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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 
1. Basis of the report 



International application No. 

PCT/FR99/02738 



1. With regard to the elements of the international application:* 
| | the international application as originally filed 
the description: 

pages . L» 

pages 

pages 



, as originally filed 
, filed with the demand 



, filed with the letter of 



the claims: 

pages 

pages 

pages 

pages 



1-16 



, as originally filed 



, as amended (together with any statement under Article 19 

, filed with the demand 



, filed with the letter of 



the drawings: 

pages 

pages 

pages 



1/7-7/7 



, as originally filed 
, filed with the demand 



, filed with the letter of 



[ | the sequence listing part of the description: 

pages 

pages 

pages 



, as originally filed 



, filed with the demand 



, filed with the letter of 



2 With regard to the language, all the elements marked above were available or furnished to this Authority in the language in which 
' the international application was filed, unless otherwise indicated under this item. 
These elements were available or furnished to this Authority in the following language . wnicn »• 

□ the language of a translation furnished for the purposes of international search (under Rule 23.1(b)). 
| | the language of publication of the international application (under Rule 48.3(b)). 

□ the language of the translation furnished for the purposes of international preliminary examination (under Rule 55.2 and/ 
or 55.3). 

I 3 With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international 
1 preliminary examination was carried out on the basis of the sequence listing: 
contained in the international application in written form, 
filed together with the international application in computer readable form, 
furnished subsequently to this Authority in written form, 
furnished subsequently to this Authority in computer readable form. 

The statement that the subsequently furnished written sequence listing does not go beyond the disclosure in the 
international application as filed has been furnished. 

The statement that the information recorded in computer readable form is identical to the written sequence listing has 
been furnished. 



□ 
□ 
□ 

□ 

14. □ 



The amendments have resulted in the cancellation of: 

| | the description, pages 

I | the claims, Nos. 

I | the drawings, sheets/fig . 



l—l This report has been established as if (some of) the amendments had not been made, since they have been considered to go 
5. | — | beyond tne disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)).** 

* Replacement sheets which have been furnished to the receiving Office in response to an invitatio m < u nde r ^^TfflSte^/S 
in this report as "originally filed" and are not annexed to this report since they do not contain amendments (Rule 70. lo 
, and 70.17). 

**Anv replacement sheet containing such amendments must be referred to under item J andannexedto this report. 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1. 


Statement 












Novelty (N) 


Claims 


in full : 2-5, 11, 
10. 12-13. 15-16 


±H t 1*1 pate- O/ 


vrc 




Claims 


in full: 1, 7-9; 
12-13, 15-16 


in part: 6, 10, 


NO 




Inventive step (IS) 


Claims 


in full: 2-5, 11, 
in. 19-11. 15-16 


14; in part: 6, 


YES 






Claims 


in full: 1, 7-9; 
12-13, 15-16 


in part: 6, 10, 


NO 




Industrial applicability (IA) 


Claims 
Claims 


1-16 




YES 








NO 


2. 


Citations and explanations 












1. Reference 


is made to 


the following 


document : 





Dl: EP-A-0 704 526 (OTSUKA PHARMA CO. LTD. (JP); 
FUJIWARA T; TAKEDA S; SHIMADA Y; OZAKI K; 
SHIN S), 3 April 1996 (1996-04-03). 

2. Document Dl, which is considered to be the most 

relevant prior art, discloses a (htfUIA gene) DNA 
sequence of the gene coding for a protein having the 
biological function of the human transcription 
factor, hTFIIIA (Dl: the abstract; pages 6 and 11- 
13). Said sequence has 99.5% nucleotide sequence 
homology, along the entire length thereof, to the 
sequences SEQ ID NO. 3 and SEQ ID NO. 4 of the 
present invention and includes modifications 
introduced by means of nucleotide suppression, 
insertion and substitution with respect to the 
aforementioned SEQ ID NO. 3 and SEQ ID NO. 4 (the 
"Bestfit" programme of the University of Wisconsin 
"Genetic Computer Group" has been used for all of 
the sequence homology analyses reported in the 
present report) . 

The DNA sequence of Dl codes for a protein having an 
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amino acid sequence with 96% homology, along the 
entire length thereof, to the sequence SEQ ID NO. 2 
of the present invention. This protein is therefore 
an analogue of the polypeptide having the sequence 
SEQ ID NO. 2. 

Document Dl describes an expression vector 
containing the aforementioned "htfUIA gene" DNA 
sequence and a host cell transformed using said 
vector (Dl: page 4 and Claims 5 and 7) . 

Moreover, document Dl describes the use of the 
hTFIIIA human transcription factor gene or the human 
transcription factor encoded by said gene in the 
.preparation of compositions useful for diagnosing or 
treating diseases related to disorders in 
transcription control, particularly cancer (Dl: page 
4 and Claims 8 and 9) . 

It follows that, in light of the above, the subject 
matter of Claims 1, 6-10, 12, 13, 15 and 16 is not 
novel (PCT Article 33(2)) (Claim 6 is not novel in 
so far as it refers to Claim 1 or to the DNA 
sequences that have significant homology to the 
sequences SEQ ID NO. 3 or SEQ ID NO. 4 of the present 
invention; Claim 10 is not novel with respect to the 
analogues of the polypeptide having SEQ ID NO. 2; 
Claims 12 and 13 are not novel in so far as they 
relate to a vector containing the DNA sequence as 
per one of Claims 6-9 and to a host cell transformed 
using said vector; Claims 15 and 16 are not novel in 
so far as they relate to the use of the 
transcription factor gene or the transcription 
factor encoded by said gene as per one of Claims 1 
and 6-9, or to the analogues of the polypeptide 
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having the sequence SEQ ID NO. 2 as per Claim 10} . 

3. In comparison with the polypeptide sequence of Dl, 
the subject matter of Claim 10 (the polypeptide 
having the sequence SEQ ID NO. 2 only) comprises 
some differences at the corresponding respective 
positions 105 and 163, 156 and 214, 320 to 329 and 
378 to 387. Moreover, the hTFIIIA polypeptide of 
the present invention having the sequence SEQ ID NO. 

2 begins at position 60 of the polypeptide sequence 
of Dl. 

The subject matter of Claim 2 differs from the DNA 
sequence of Dl in that the DNA sequence of Dl codes 
for a protein having the aforementioned sequence 
differences . 

The subject matter of Claims 3-5 differs from the 
DNA sequence of Dl in that the DNA sequence of Dl 
includes modifications introduced by means of 
nucleotide suppression, insertion and substitution 
with respect to the nucleotide sequences SEQ ID NO. 

3 and SEQ ID NO. 4. 

It follows that the subject matter of Claims 2-6 
(Claim 6: in so far as said claim refers to Claims 
2-5) , 10 (the polypeptide having the sequence SEQ ID 
NO. 2 only) is novel (PCT Article 33(2)). 

4.1 In light of the aforementioned document Dl, the 

problem which the present invention aims to solve 
can be considered to be that of providing an 
alternative protein having the biological function 
of the human transcription factor, hTFIIIA, 
corresponding materials (gene coding for said 
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protein, corresponding vector and host cell) and the 
use of said protein or corresponding gene. 

4.2 The solution to this problem, as proposed in Claims 
2-5 and 10 (Claim 10: the polypeptide having 
sequence SEQ ID NO. 2 only) of the present 
application, is considered to involve an inventive 
step (PCT Article 33(3)) for the following reasons: 
there is no indication in Dl that could be 
considered to suggest to a person skilled in the art 
to seek the existence of the protein having the 
amino acid sequence SEQ ID NO. 2 or the 
corresponding gene. 

5. Claims 11-16 also fulfil the requirements of the PCT 
concerning novelty (PCT Article 33(2)) and inventive 
step (PCT Article 33(3)), in so far as they relate 
to a method for preparing the hTFIIIA recombinant 
protein having the amino acid sequence SEQ ID NO: 2 
(Claim 11) , to an expression vector containing the 
DNA sequence as per one of Claims 3 to 6 (Claim 12; 
concerning Claim 6: in so far as said claim refers 
to Claims 2-5), to a host cell transformed using 
said vector (Claim 13), to a plasmid containing the 
cDNA coding region of the hTFIIIA as per the present 
invention (Claim 14) and to the use in the 
preparation of compositions useful for diagnosing or 
treating diseases, involving the DNA sequences 
SEQ ID NO. 3 or SEQ ID NO. 4, or the protein having 
the amino acid sequence SEQ ID NO. 2 (Claims 15 and 
16) . 
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VIII. Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

It is not indicated in Claims 8 and 9 whether the 
percentages of homology relate to the entire length of the 
sequences in question or to fragments. 

It follows that the subject matter of Claims 8 and 9 is 
ambiguous and Claims 8 and 9 do not fulfil the 
requirements of PCT Article 6. 
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lui ont ete remis dans la langue dans laquelle la demande internationale a ete deposee, sauf indication contratre 
donnee sous ce point. 

Ces elements etaient a la disposition de ['administration ou lui ont ete remis dans la langue suivante: , qui est : 

□ la langue d'une traduction remise aux fins de la recherche internationale (selon la regie 23.1 (b)). 

□ la langue de publication de la demande internationale (selon la regie 48.3(b)). 

□ la langue de la traduction remise aux fins de I'examen preliminaire internationale (selon la regie 55.2 ou 



3. En ce qui concerne les sequences de nucleotides ou d acide amines divulguees dans la demande 

internationale (le cas echeant), I'examen preliminaire internationale a ete effectue sur la base du listage des 
sequences : 

El contenu dans la demande internationale, sous forme ecrite. 

S depose avec la demande internationale, sous forme dechiffrable par ordinateur. 

□ remis ulterieurement a ('administration, sous forme ecrite. 

□ remis ulterieurement a I'administration, sous forme dechiffrable par ordinateur. 

□ La declaration, selon laquelle le listage des sequences par ecrit et foumi ulterieurement ne va pas au-dela 
de la divulgation faite dans la demande telle que deposee, a ete fournie. 



55.3). 
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□ La declaration, selon laquelle les informations en registries sous d6chiffrable par ordinateur sont identiques a 
celles du listages des sequences Presents par 6crit, a et6 fournie. 

4. Les modifications ont entraTne I'annulation : 

□ de la description, pages : 

□ des revendications, n 05 : 

□ des dessins, feuilles : 

5. □ Le present rapport a 6t6 formule abstraction faite (de certaines) des modifications, qui ont 6t6 considered 

comme allant au-dela de I'exposS de I'invention tel qu'il a eXe depose, comme il est indique ci-apres (regie 
70.2(c)) : 

(Toute feuille de rempfacement comportant des modifications de cette nature doit etre indiquee au point 1 et 
annexe" e au present rapport) 



6. Observations complementaires, le cas echiant : 



V. Declaration motivee selon Particle 35(2) quant a la nouveaute, I'activite inventive et la possibilite 
d'application industrielle; citations et explications a I'appui de cette declaration 



1. Declaration 
Nouveaute 

Activite inventive 



Oui : Revendications completement: 2-5, 11, 14, partiellement: 6, 10, 

12-13, 15-16 

Non : Revendications completement: 1, 7-9; partiellement: 6, 10, 12-13, 

15-16 

Oui : Revendications completement: 2-5, 11, 14, partiellement: 6, 10, 

12-13, 15-16 

Non : Revendications completement: 1, 7-9; partiellement: 6, 10, 12-13, 

15-16 



Possibilite d'application industrielle Oui: Revendications 1-16 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VIII. Observations relatives a la demande internationale 

Les observations suivantes sont faites au sujet de la clart£ des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent entierement sur la description : 
voir feuille separee 
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Concernant le point V 

Declaration motivee selon la regie 66.2(a)(ii) quant a la nouveaute, I'activite 
inventive et la possibility d'application industrielle; citations et explications a 
I'appui de cette declaration 

1) . II est fait reference au document suivant: 

D1 : EP-A-0 704 526 (OTSUKA PHARMA CO., LTD. (JP); FUJIWARA T.; 

TAKEDA S.; SHIMADA Y.; OZAKI K.; SHIN S.), 3 avril 1996 (1996-04-03). 

2) . Le document D1 , qui est considere comme representant I'etat de la technique le 

plus pertinent, divulgue une sequence d'ADN (gene htflllA) du gene codant pour 
une proteine ayant la fonction biologique du facteur de transcription humain 
hTFIIIA (D1 : abrege, pages 6 et 11-13). Cette sequence a une homologie de 
sequence nucleotidique de 99.5% avec les sequences SEQ ID N°3 et SEQ ID 
N°4 de la presente invention, sur toute la longueur, et comprend des modifications 
introduites par suppression, insertion et substitution de nucleotides par rapport 
aux susdites SEQ ID N°3 et SEQ ID N°4 (le program " Bestfit " de I'Universite du 
Wisconsin " Genetic Computer Group 11 a ete utilise pour toutes les analyses 
d'homologie de sequence rapportees ici). 

La sequence d'ADN de D1 code pour une proteine dont la sequence en acides 
amines a une homologie de 96% avec la sequence SEQ ID N°2 de la presente 
invention, sur toute la longueur. Done cette proteine est un analogue du 
polypeptide ayant la sequence SEQ ID N°2. 

Le document D1 decrit un vecteur d'expression contenant la susdite sequence 
d'ADN " htflllA gene " et une cellule note transformee avec ledit vecteur (D1 : 
page 4 et revendications 5 et 7). 

En plus le document D1 decrit I'utilisation du gene du facteur de transcription 
humain htflllA ou du facteur de transcription humain code par ce gene pour la 
preparation de compositions utiles pour le diagnostic ou le traitement de maladies 
iiees a un desordre dans le controle de la transcription, notamment pour le cancer 
(D1 : page 4 et revendications 8 et 9). 

Au vu des mentions faites ci-dessus, I'objet des revendications 1, 6-10, 12, 13,. 15 
et 16 n'est done pas nouveau (article 33(2) PCT; pour la revendication 6 dans la 
mesure ou cette revendication se refere a la revendication 1 ou aux sequences 
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d'ADN qui presentent des homologie significatives avec les sequences SEQ ID 
N°3 ou SEQ ID N°4 de la presente invention; pour la revendication 10, en ce qui 
concerne les analogues du polypeptide ayant la sequence SEQ ID N°2; pour les 
revendications 12 et 13 dans la mesure ou ces revendications se referent a un 
vecteur contenant la sequence d'ADN selon Tune des revendications 6-9 et a une 
cellule note transformee avec ledit vecteur; pour les revendications 15 et 16 dans 
la mesure ou ces revendications se referent a I'utilisation du gene du facteur de 
transcription ou du facteur de transcription code par ce gene, selon I'une des 
revendications 1, 6-9 ou aux analogues du polypeptide ayant la sequence SEQ ID 
N°2, selon la revendication 10). 

3). L'objet de la revendication 10 (en ce qui concerne le polypeptide ayant la 
sequence SEQ ID N°2) comporte des differences avec la sequence du 
polypeptide de D1 aux positions respectives correspondantes 105 et 163, 156 et 
214, 320 a 329 et 378 a 387. En plus, le polypeptide hTFIIIA de la present 
invention, ayant la sequence SEQ ID N°2, debute en position 60 de la sequence 
du polypeptide de D1. 

L'objet de la revendication 2 differe de la sequence d'ADN de D1 en ce que la 
sequence d'ADN de D1 code pour une proteine ayant les differences de 
sequence mentionnees ci-dessus. 

L'objet des revendications 3-5 differe de la sequence d'ADN de D1 en ce que 
cette sequence d'ADN de D1 comprend des modifications introduces par 
suppression, insertion et substitution de nucleotides par rapport aux sequences 
de nucleotides SEQ ID N°3 et SEQ ID N°4. 

L'objet des revendications 2-6 (pour la revendication 6 dans la mesure ou cette 
revendication se refere a les revendications 2-5), 10 (pour la revendication 10 en 
ce qui concerne le polypeptide ayant la sequence SEQ ID N°2) est done nouveau 
(article 33(2) PCT). 

4.1). Au vu du document D1 mentionne ci-dessus, le probleme que la presente 

invention se propose de resoudre peut etre considere comme la fourniture d'une 
proteine alternative ayant la fonction biologique du facteur de transcription humain 
hTFIIIA, des produits correspondents (gene codant pour ladite proteine, vecteur et 
cellule hote correspondants) et I'utilisation de la proteine ou du gene 
correspondant. 
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4.2). La solution de ce probleme proposee dans les revendications 2-5 et 10 (pour la 
revendication 10 en ce qui concerne le polypeptide ayant la sequence SEQ ID 
N°2) de la presente demande est consideree comme impliquant une activite 
inventive (article 33(3) PCT), et ce pour les raisons suivantes: D1 ne donne 
aucune signe qui pourrait etre considere comme un suggestion pour I'homme de 
metier de rechercher ('existence de la proteine ayant la sequence d'acides amines 
SEQ ID N°2 ou du gene correspondant. 

5). Les revendications 11-16, dans la mesure ou ils se referent a un procede de 
preparation de la proteine recombinante hTFIIIA ayant la sequence d'acides 
amines SEQ ID N°2 (rev. 1 1), a un vecteur d'expression contenant la sequence 
d'ADN selon Tune des revendications 3 a 6 (rev. 12; pour la revendication 6 dans 
la mesure ou cette revendication se refere a les revendications 2-5), a une cellule 
note transformee avec ledit vecteur (rev. 13), a un plasmide contenant la region 
d'ADNc codante de hTFIIIA selon la presente invention (rev. 14) et a I'utilisation 
pour la preparation de compositions utiles pour le diagnostic ou traitement de 
maladies, impliquant les sequences d'ADN SEQ ID N°3 ou SEQ ID N°4, ou la 
proteine ayant la sequence d'acides amines SEQ ID N°2 (rev. 15 et 16), satisfont 
egalement aux conditions requises par le PCT en ce qui concerne la nouveaute 
(article 33(2) PCT) et I'activite inventive (article 33(3) PCT). 

Concernant le point VIII 

Observations relatives a la demande internationale 

II n'est pas indique dans les revendications 8 et 9 si les homologies se referent a toute 
la longueur en entier des sequences impliquees ou a des fragments. 
Par consequent, I'objet des revendications 8 et 9 est ambigu et les revendications 8 et 
9 ne satisfont pas aux conditions requises a I'article 6 PCT. 
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I. Basis of the report 

1 . This report has been drawn on the basis of the following material (the substitute sheets which have been sent 
to the receiving office in response to a request made in accordance with Article 14 are considered, in this 
report, as having been "originally filed" and are not annexed to the report since they do not contain 
amendments (rides 70. 16 and 70,17).): 

Description, pages: 

1-26 as originally filed 

Claims, nos.: 

1-16 as originally filed 

Drawings, sheets: 

Ml -HI as originally filed 

Portion of application reserved for sequence listing, pages: 
1-6, as originally filed 



2. As regards the language, all the elements indicated above were at the disposal of the administration or were 
furnished to it in the language in which the international application was filed, except where a contrary 
indication is given regarding this point. 

These elements were at the disposal of the administration or were delivered to it in the following language, 
which is: 

1 1 the language of a translation furnished for the purposes of the international search (according to rule 
23.1(b)). 

I I the publication language of the international application (according to rule 48.3(b)). 

f~| the translation language furnished for the purposes of the international preliminary examination report 
(according to rule 55.2 or 55.3) 

3. As regards the nucleotide or amino acid sequences disclosed in the international application (if appropriate), 
the international preliminary examination report was carried out on the basis of the sequence listings: 

£3 contained in the international application, in written form. 

K| filed with the international application, in computer-readable form. 

I I furnished to the administration later, in written form. 

I I furnished to the administration later, in computer-readable form. 

!~l The declaration, according to which the sequence listing in writing and provided later does not go further 
than the disclosure made in the application as filed, was provided. 

(~~3 The declaration, according to which the information recorded in computer readable form is identical to 
that of the sequence listings presented in writing, was provided. 

4. The amendments have led to the revocation: 
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of the description, 
of the claims, 
I 1 of the drawings, 



pages: 

Nos.: 

pages: 



5. CH The present report was drawn up disregarding (some of) the amendments, which were considered as going 

further than the disclosure of the invention as filed, as indicated hereafter (rule 70.2(c)): 

(Any amended page comprising amendments of this type must be indicated in point / and attached to the 
present report) 

6. Additional observations, if necessary: 

1 

V. Reasoned statement under Article 35(2) with regard to novelty, inventive step and industrial 
applicability; citations and explanations supporting such statement 



Statement 
Novelty 

Inventive step 

Industrial applicability 



Yes: Claims 
No: Claims 

Yes: Claims 
No: Claims 

Yes: Claims 
No: Claims 



completely: 2-5, 11,14, partially: 6, 10, 12-13, 15-16 
completely: 1, 7-9; partially: 6, 10, 12-13, 15-16 

completely: 2-5, 11, 14, partially: 6, 10, 12-13, 15-16 
completely: 1, 7-9; partially: 6, 10, 12-13, 15-16 

1-16 



2. Citations and explanations 

see separate sheet 
VIII. Observations on the international application 

The following observations were made as regards the clarity of the claims, the description and the drawings and the 
question of whether the claims are based entirely on the description: 
see separate sheet 
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Concerning point V 

Reasoned statement in accordance with rule 66.2(a)(ii) regarding novelty, inventive 
step and industrial applicability; citations and explanations supporting such 
statement 

1) . Reference is made to the following document: 

D1: EP-A-0 704 526 (OTSUKA PHARMA CO., LTD. (JP); FUJIWARA T.; 

TAKEDA S.; SHIMADA Y.; OZAKI K.; SHIN S.)- 3rd April 1996 (1996-04-03). 

i 

2) . Document D1, which is regarded as representing the most relevant state of the art, 

discloses a DNA sequence (htflilA gene) of the gene coding for a protein having the 
biological function of the human transcription factor hTFIIIA (D1: abstract, pages 6 and 
11-13). This sequence has a 99.5% nucleotide sequence homology with the 
sequences SEQ ID No. 3 and SEQ ID No. 4 of the present invention, over the whole 
length, and contains modifications introduced by suppression, insertion and 
substitution of nucleotides relative to the aforementioned SEQ ID No. 3 and SEQ ID 
no. 4 (the "Bestfit" program of the University of Wisconsin "Genetic Computer Group" 
was used for all the sequence homology analyses reported here). 
The DNA sequence of D1 codes for a protein the amino acid sequence of which has a 
96% homology with the sequence SEQ ID No. 2 of the present invention, over the 
whole length. This protein is thus an analogue of the polypeptide having the sequence 
SEQ ID No. 2. 

Document D1 describes an expression vector containing the aforementioned DNA 
sequence "htflilA gene" and a host cell transformed with the said vector (D1: page 4 
and claims 5 and 7). 

Moreover, document D1 describes the use of the gene of the human transcription 
factor htflilA or of the human transcription factor coded by this gene for the preparation 
of compositions useful for the diagnosis or treatment of illnesses associated with a 
disorder in the control of the transcription, in particular for cancer (D1: page 4 and 
claims 8 and 9). 
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In the light of the above references, the subject-matter of claims 1, 6-10, 12, 13, 15 
and 16 is thus not novel (article 33(2) PCT; for claim 6 inasmuch as this claim refers to 
claim 1 or to the DNA sequences which display significant homologies with the 
sequences SEQ ID No. 3 or SEQ ID No. 4 of the present invention; for claim 10, as 
regards the analogues of the polypeptide having the sequence SEQ ID No. 2; for 
claims 12 and 13 inasmuch as these claims refer to a vector containing the DNA 
sequence according to one of claims 6-9 and to a host cell transformed with the said 
vector; for claims 15 and 16 inasmuch as these claims refer to the use of the gene of 
the transcription factor or of the transcription factor coded by this gene, according to 
bne of claims 1, 6-9 or to the analogues of the polypeptide having the sequence SEQ 
ID No. 2, according to claim 10). 

3). The subject-matter of claim 10 (as regards the polypeptide having the sequence SEQ 
ID No. 2) contains differences from the sequence of the polypeptide of D1 at the 
corresponding respective positions 105 and 163, 156 and 214, 320 to 329 and 378 to 
387. Moreover, the hTFIIIA polypeptide of the present invention, having the sequence 
SEQ ID No. 2, starts at position 60 of the sequence of the polypeptide of D1. 
The subject-matter of claim 2 differs from the DNA sequence of D1 in that the DNA 
sequence of D1 codes for a protein having the sequence differences mentioned 
above. 

The subject-matter of claims 3-5 differs from the DNA sequence of D1 in that this DNA 
sequence of D1 contains modifications introduced by suppression, insertion and 
substitution of nucleotides relative to the sequences of nucleotides SEQ ID No. 3 and 
SEQ ID No. 4. 

The subject-matter of claims 2-6 (for claim 6 inasmuch as this claim refers to claims 2- 
5), 10 (for claim 10 as regards the polypeptide having the sequence SEQ ID No. 2) is 
thus novel (article 33(2) PCT). 

4.1) In the light of document D1 mentioned above, the problem that the present invention 
proposes to resolve can be seen as the provision of an alternative protein having the 
biological function of the human transcription factor hTFIIIA, corresponding products 
(gene coding for the said protein, corresponding vector and host cell) and the use of 
the protein or of the corresponding gene. 
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4.2) The solution to this problem that is proposed in claims 2-5 and 10 (for claim 10 as 
regards the polypeptide having the sequence SEQ ID No. 2) of the present application 
is seen as involving an inventive step (article 33(3) PCT), for the following reasons: D1 
gives no indication that could be regarded as suggesting that the person skilled in the 
art seek the existence of the protein having the sequence of amino acids SEQ ID No. 
2 or of the corresponding gene. 

5). Claims 11-16, inasmuch as they refer to a preparation process of the recombinant 
protein hTFIIIA having the sequence of amino acids SEQ ID No. 2 (cl. 11), to an 
expression vector containing the DNA sequence according to one of claims 3 to 6 (cl. 
12; for claim 6 inasmuch as this claim refers to claims 2-5), to a host cell transformed 
with the said vector (cl. 13), to a plasmid containing the cDNA region coding for 
hTFIIIA according to the present invention (cl. 14) and to the use for the preparation of 
compositions useful for the diagnosis or treatment of diseases, involving the DNA 
sequences SEQ ID No. 3 or SEQ ID No. 4, or the protein having the sequence of 
amino acids SEQ ID No. 2 (cl. 15 and 16), also satisfy the requirements of the PCT as 
regards novelty (article 33(2) PCT) and inventive step (article 33(3) PCT). 

Concerning point VIM 

Comments relating to the international application 

It is not indicated in claims 8 and 9 whether the homologies refer to the entire length of the 
sequences involved or to fragments. 

Consequently, the subject-matter of claims 8 and 9 is ambiguous and claims 8 and 9 do not 
satisfy the requirements of article 6 PCT. 
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La presence invention concerne le gene codant pour le 
facteur de transcription humain nomme ci-apres gene htflllA 
(ou htfC2) et la proteine codee hTFIIIA ainsi que 1' utilisa- 
tion de ce gene htflllA et celui de la proteine codee hTFIIIA 
dans le diagnostic et 1 ' identification de certaines maladies 
liees au mecanisme de la transcription. 

Nous appellerons ci-apres tfHIA (ou tfC2) le gene 
codant pour le facteur de transcription TFIIIA et htflllA le 
gene codant pour le facteur de transcription humain hTFIIIA . 
Le gene humain htflllA code done pour la proteine correspon- 
dante hTFIIIA. 

.. Nous utiliserons egalement ci-apres les abreviations 
suivantes : AA pour acides amines, AN pour acides nucleiques, 
pb pour paires de bases, ADN pour acide desoxyribonucleique , 
ADNc pour ADN complement aire , ARN pour acide ribonucleique et 
RNase pour ribonuclease et C pour desoxycytidine . 

On utilisera egalement le terme screening qui designe 
une technique de criblage specifique et le terme primer qui 
designe un oligonucleotide utilise en amorce. 
Le gene tfHIA et la proteine correspondante TFIIIA seraient 
impliques dans la regulation du mecanisme biologique de la 
transcription comme indique ci-apres. 

Depuis que la proteine TFIIIA a ete purifiee comme 
facteur de transcription pour la premiere fois en 1980 a 
partir d'ovocytes de Xenope [Segall et Al, J. Biol. Chem. , 
255, 11986-11991 (1980)], des travaux ont ete menes in vivo 
et in vitro dans le Xenope pour etudier le mecanisme de 
controle de la transcription exerce par TFIIIA. On a ainsi 
montre que TFIIIA de Xenope est n£cessaire pour 1' initiation 
de la transcription du gene ARN 5S [Sakonji et al, Cell 19, 
13-25 (1980)] et se lie a une region de controle interne du 
gene ARN 5S ' [Bogenhagen et al, Cell, 19,27-35 (1980)]. 

La sequence en nucleotides de 1'ADNc de tfHIA de Xenope 
et la sequence correspondante d' acides amines ont d£ja ete 
publiees [Ginberg et al , Cell 39,479-489 (1984)]. On peut 
noter que ce gene code pour une structure en 9 doigts de 
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zinc, un doigt de zinc correspondant a la repetition du motif 
CYS2 HIS2 (C2H2) . Cette structure en doigt de zinc est 
considered comme un domaine essentiel pour un groupe de 
proteines qui se lient a l'ADN (DNA binding proteins) [Miller 
5 et al, Embo J. , 4, 1607-1614 (1985)]. 

On connait ainsi dans l'etre humain des facteurs de 
transcription se liant a l'ADN qui possedent egalement cette 
structure en doigt de zinc tels que par exemple XT1 du gene 
de la tumeur humaine de Wilms, [Gessier et al, Nature, 343, 
10 774-778 {1990)}, le represseur humain de transcription YY1 
[SHI et al, Cell, 67, 377-388 (1991)], la proteine MAZ 
associee au gene humain MYC [Bossone et al, Proc . Natl. Acad. 
Sci., USA, 89, 7452-7456 (1992)] ou encore spl [Kuwahara et 
al,.' J.Biol. Chem., 29, 8627-8631 (1990)]. 
15 Des travaux ont ete effectues afin d'isoler le gene 

humain htflllA, mais aucun jusqu'ici n'a abouti a mettre en 
evidence la veritable sequence du gene htflllA. 

On peut citer ainsi d'une part les travaux decrits dans 
la demande europeenne EP 0704526 (Fujisawa et al) , et repris 
20 dans 1' article : Arakawa et al (1995), Cytogenet Cell Genet 
70, 235-238, qui ont abouti a une sequence que nous appelle- 
rons htflllA de Arakawa et d' autre part les travaux decrits 
dans 1'article : DREW et al (1995), Gene 159, 215-218, qui 
ont abouti a une sequence que nous appellerons htflllA de 
25 DREW. Ces sequences htflllA de DREW et de ARAKAWA sont 
representees respect ivement aux figures 4 et 5 ci-apres. 
Les documents indiques ci-dessus decrivent done chacun une 
sequence du gene htflllA mais ces deux sequences different 
l'une de 1' autre par quelques nucleotides et different du 
30 gene htflllA de la presente demande comme indique ci-apres. 

La presente invention a permis d'isoler le gene codant 
pour le facteur de transcription humain hTFIIIA . 

La presente invention a egalement permis de reveler la 
sequence d'acides nucleiques du gene htflllA et egalement la 
•3 5 sequence d'acides amines de la proline hTFIIIA codee par ce 
gene . 

La presente invention a ainsi pour objet la sequence 
d'ADN du gene htflllA codant pour une proteine ayant la 



WO 00/28024 



PCT/FR99/02738 



3 

fonction biologique du facteur de transcription humain 
hTFIIIA. 

La presente invention a precisement pour objet la 
sequence d'ADN du gene htfUIA du facteur de transcription 
5 humain hTFIIIA telle que definie ci-dessus codant pour la 
sequence d' acides amines SEQ ID N°2. 

Une telle sequence SEQ ID n°2 de la presente invention 
comprend done 3 65 acides amines. 

La presente invention a aussi pour objet la sequence 
10 d'ADN du gene htfUIA comme defini ci-dessus contenant la 
sequence de nucleotides SEQ ID N°3. 

La presente invention a aussi pour objet la sequence 
d'ADN du gene htfUIA comme defini ci-dessus contenant la 
sequence de nucleotides SEQ ID N°4. 
!5 La presente invention a aussi pour objet la sequence 

d'ADN du gene htfUIA comme defini ci-dessus correspondant a 
la sequence de nucleotides SEQ ID N°3. 

La sequence SEQ ID N°3 comprend done 1273 nucleotides. 
La presente invention a notamment pour objet la sequence 
20 d'ADN du gene htfUIA comme defini ci-dessus correspondant a 
la sequence de nucleotides SEQ ID N°4 . La sequence SEQ ID N°4 
comprend done 1213 nucleotides. 

La sequence SEQ ID N°l represente sur la ligne superieure la 
sequence de nucleotides du gene htfFIIIA selon la presente 

25 invention soit SEQ ID N°3, et sur la ligne inferieure, la 
sequence correspondante en acides amines (AA) de cette 
sequence de nucleotides soit SEQ ID N°2. 

Les figures 1 et 2 ci-apres representent sur la ligne 
superieure la sequence d' AA codee par htfUIA de la presente 

30 invention SEQ ID N°2 et sur la ligne inferieure, les 

sequences d' AA codees respectivement par les genes htfUIA de 
DREW, a la figure 1, et de ARAKAWA, a la figure 2, ces 
sequences de DREW et ARAKAWA etant telles que publiees dans 
les documents references ci-dessus. 

35 La figure 3 ci-apres represente la comparaison des 

sequences d' AA codees respectivement par les genes htfUIA de 
DREW et de ARAKAWA avec sur la ligne superieure, la sequence 
d'AA codee par htfUIA de ARAKAWA et sur la ligne inferieure, 
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la sequence d'AA codee par htfUIA de DREW . 

La figure 2 tnontre done que la sequence d'AA 
correspondante de htfUIA selon la presente invention 
comporte des differences avec la sequence d'AA publiee dans 
5 1' article de ARAKAWA ou dans EP 0704 526, notamment aux 

positions respectives correspondantes 105 et '163, 156 et 214, 
320 a 329 et 378 a 387, ces positions etant donnees par 
rapport a la numerotation indiquee sur la figure 2. 

Cette figure 2 montre egalement que la sequence d'AA 
10 codee par htfUIA de la presente invention debute en position 
5 9 de la sequence en AA de htflllA de ARAKAWA. 

La figure 3 montre que les sequences d'AA codees par 
htfUIA de ARAKAWA et de DREW comportent des differences aux 
positions respectives correspondantes 214 et 154, 378-387 et 
15 318-327, ces positions etant donnees par rapport a la 
numerotation indiquee sur la figure 3 . 

La figure 5 montre que la sequence htfUIA de ARAKAWA 
code pour une proteine dont la sequence en acides" amines, 
indiquee dans EP 0704 526, commence par 1'AA methionine 
20 specifie par le codon ATG qui se trouve en position 20-22 et 
la traduction s'arrete a un codon T AA . Si.l'on compare la 
sequence de nucleotides de htfUIA selon la presente 
invention SEQ ID -N°3 avec la sequence de nucleotides de EP 
0704 526 soit htfUIA de ARAKAWA representee a la figure 5 
25 (sequence pll-12-13 de EP 0704 526), on constate qu'il manque 
un nucleotide C a la position 127 de la' sequence de EP 0704 
526. Ce nucleotide C supplementaire a pour consequence un 
decalage dans la traduction en acides amines de cette 
sequence de nucleotides : en effet, 1'ATG qui se trouve a la 
30 position 20-22 de la sequence de ARAKAWA representee a la 
figure 5 et qui est considere comme codon initiateur de la 
synthese proteique par ARAKAWA n'est done plus, du fait de ce 
decalage, dans la meme phase de lecture. En tenant compte de 
ce nucleotide supplementaire C, la traduction en AA fait 
35 apparaitre un codon de terminaison TGA en position 57-59 de 
la sequence de ARAKAWA representee a la figure 5. Par 
consequent, le codon initiateur de la synthese proteique 
selon la presente invention est localisee en aval de ce codon 
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de terminaison . Des experiences de traduction in vitro de SEQ 
ID N°4 et des tests d' expression dans des cellules de 
mammiferes telles que des cellules Cos ont permis 
d' identifier le codon d' initiation de la synthese proteique 
5 de hTFIIIA selon la presente invention. 

Ce codon initiateur de la synthese proteique de hTFIIIA 
selon la presente invention est le codon CTG en position 176- 
178 de SEQ ID N°3 (qui correspondrait a la position 194-196 
de la sequence de ARAKAWA representee a la figure 5) . / 

10 La partie codante du gene htfUIA de la presente 

invention commence done par ce codon CTG qui se trouve a la 
position 176 T 178 de SEQ ID N°3 qui devrait correspondre a 
l'AA Leucine et qui correspond en fait a 1'AA Methionine 
puisque ce codon est reconnu comme codon initiateur (ref : 

15 David S. Peabody The Journal of Biological Chemistry, vol. 
264, n°9, pp. 5031-5035, 1989). 

En consequence, la proteine hTFIIIA. de ARAKAWA est plus 
longue comme le montre la figure 2, que la proteine hTFIIIA 
de la presente invention. 

20 Par ailleurs, si 1 ' on compare la proteine hTFIIIA de la 

presente invention et la proteine hTFIIIA de DREW, (comparai- 
son representee a la figure 1), on constate que 1'acide amine 
threonine en position 105 de la proteine hTFIIIA de la 
presente invention correspond a un residu asparagine en 

25 position 103 dans la sequence hTFIIIA de DREW et que les deux 
premiers AA, M et D de la proteine hTFIIIA de la presente 
invention n'ont pas ete determines pour la proteine hTFIIIA 
de DREW. L ' absence des codons specif iant ces AA et notamment 
1' absence du codon initiateur de la synthese proteique, ne 

3 0 permet pas 1' expression de cette proteine. La sequence 
htfUIA de DREW representee a la figure 4 est done incom- 
plete, comme le reconnaissent les auteurs de la publication 
referencee ci-dessus (DREW et al a la page 216 lignes 39-41) . 
On peut noter d' ailleurs que les auteurs de cet article 

3 5 pensent egalement que le codon initiateur de la sequence 

htfUIA de DREW devrait correspondre a une methionine cod£e 
par ATG comme dans la sequence de ARAKAWA. 

Le gene htfUIA selon la presente invention est done 
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different des genes htfUIA de DREW et ARAKAWA (EP 0704526) 
et code pour une proteine hTFIIIA dont la sequence en AA est 
differente de celle des proteines hTFIIIA de DREW et ARAKAWA. 
La presente invention a ainsi particulierement pour 
5 objet la sequence d ' ADN du gene htfUIA comme defini ci- 
dessus contenant la sequence de nucleotides SEQ ID N°3. 

La presente invention a plus particulierement pour objet 
la sequence d' ADN comme defini ci-dessus ayant la sequence 
commencant au nucleotide 176 et se terminant au nucleotide 
10 1270 de SEQ ID N°3 . 

Une telle sequence de la presente invention commence 
done a un codon CTG et comprend done 1095 nucleotides. 

La presente invention a egalement pour objet la sequence 
d' ADN codant pour l e> f acteur de transcription humain hTFIIIA 
15 comme defini ci-dessus ainsi que les sequences d ' ADN qui 
hybrident avec celle-ci et/ou presentent des homologies 
significatives avec cette sequence ou des -fragments de celle- 
ci et codant pour des proteines ayant la meme fonction. 
Par sequences qui hybrident, on inclut les sequences d'ADN 
20 qui hybrident avec 1'une des sequences d'ADN ci-dessus sous 
des conditions standard de stringence elevee, moyenne ou 
basse. Par proteines ayant la meme fonction, on inclut les 
polypeptides ayant la meme fonction de facteur de transcrip- 
tion. Les conditions de stringence sont celles realisees dans 
25 les conditions connues de l'homme du metier telles que celles 
decrites par Sambrook et al (1989) Molecular cloning, Cold 
Spring Harbor Laboratory Press, 1989. De telles conditions de 
stringence sont par exemple une hybridation a 65 °C, pendant 
18 heures dans une solution 5 x SSPE ; 10 x Denhardt ' s ; 
3 0 100 M g/ml ADNss ; 1 % SDS suivie de 3 lavages pendant 5 minu- 
tes avec 2 x SSC ; 0,05 % SDS, puis 3 lavages pendant 15 
minutes a 65°C dans 1 x SSC ; 0,1 % SDS . Les conditions de 
forte stringence comprennent par exemple une hybridation a 
65 °C, pendant 18 heures dans une solution 5 x SSPE ; 10 x 
35 Denhardt 's ; 100/ig/ml ADNss ; 1 % SDS suivie de 2 lavages 
pendant 20 minutes avec une solution 2 x SSC ; 0,05 % SDS a 
65°C suivis d'un dernier lavage pendant 45 minutes dans une 
solution 0,1 x SSC ; 0,1 % SDS a 65 °C. Les conditions de 
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stringence moyenne comprennent par exemple un dernier lavage 
pendant 20 minutes dans une solution 0,2 x SSC, 0,1 % SDS a 
65°C. 

Par sequences qui presentent des homologies signif icatives , 
5 on inclut les sequences ayant une identite de sequence 

nucleotidique d'au moins 50 % avec 1 ' une des sequences d'ADN 
ci-dessus et qui codent pour une proteine ayant la meme 
fonction de facteur de transcription. 

La presente invention a egalement pour ob j et la sequence 
10 d'ADN comme defini ci-dessus comprenant des modifications 
introduites par suppression, insertion et/ou substitution 
d'au moins un nucleotide codant pour une proteine ayant la 
meme activite biologique que le facteur de transcription 
humain hTFIIIA. 

15 La presente invention a notamment pour objet la sequence 

d'ADN telle que definie ci-dessus ainsi que les sequences 
d'ADN similaires qui ont une homologie de sequence 
nucleotidique d'au moins 5 0 % ou au moins 60 % et de 
preference au moins 70 % avec ladite sequence d'ADN. 

2 0 La presente invention a ainsi egalement pour objet la 

sequence d'ADN telle que definie ci-dessus ainsi que les 
sequences d'ADN qui codent pour une proteine dont la sequence 
en AA a une homologie d'au moins 40 % et notamment de 45 % ou 
d'au moins 50 %, plutot au moins 60 % et de preference au 
25 moins 70 % avec la sequence en AA codee par ladite sequence 
d'ADN. 

Le gene de la presente invention est represents comme 
une sequence ADN simple brin mais il est entendu que la 
presente invention inclut la sequence ADN complementaire de 

3 0 cette sequence ADN simple brin et inclut egalement la 

sequence ADN dite double brin constitute de ces deux 
sequences ADN complementaires d'une de 1 ' autre . 

La sequence ADN de la presente invention est un exemple 
de combinaison de codons codant pour les acides amines 
35 correspondant a la sequence d' acides amines SEQ ID N°2 mais 
il est entendu egalement que la presente invention inclut 
toute autre combinaison arbitraire de codons codant pour 
cette meme sequence d' acides amines SEQ ID N°2. 



WO 00/28024 



PCT/FR99/02738 



8 

La sequence d'ADN telle que definie ci-dessus ou cette 
sequence d'ADN modifiee comme indiquee ci-dessus, peut etre 
preparee selon les techniques connues de 1 ' homme du metier et 
notamment celles decrites dans I'ouvrage de Sambrook, 

5 J. Fritsh, E . F. § Maniatis, T. (1989) intitule : « Molecular 
cloning : a laboratory manual ", Laboratory, Cold Spring 
Harbor NY. Notamment la sequence d'ADN ci-dessus peut etre 
une sequence d'ADNc obtenue par identification des parties 3' 
et 5' de la sequence codante, puis amplification de ces 

.0 parties a 1'aide d'une ADN polymerase telles que la pfu 

polymerase ou d'autres ADN polymerases. L' introduction, dans 
la sequence des oligonucleotides utilises pour la PCR, de 
sites de restriction tels que Hind III ou Smal permet le 
clonage de ces fragments dans des vecteurs adequats et 

5 ensuite la reconstitution de la sequence complete recherchee . 
Une description detaillee des conditions operatoires dans 
lesquelles a ete realisee la presente invention est donnee 
ci-apres . 

L ' invention a tout particulierement pour objet le 
0 polypeptide ayant la fonction de facteur de transcription 
humain hTFIIIA et ayant la sequence d'acides amines SEQ ID 
N°2 codee par la sequence d'ADN comme defini ci-dessus et les 
analogues de ce polypeptide. 

Par analogues, on entend les polypeptides dont la 
5 sequence d'acides amines a ete modifiee par substitution, 
suppression ou addition d'un ou plusieurs acides amines mais 
qui conservent la meme fonction biologique. De tels 
polypeptides analogues peuvent etre produits spontanement ou 
peuvent etre produits par modification post- transcript ion- 
) nelle ou encore par modification de la sequence ADN de la 
presente invention comme indique ci-dessus, en utilisant les 
techniques connues de 1 ' homme du metier : parmi ces techni- 
ques, on peut citer notamment la technique de mutagenese 
dirigee (Kramer, W., et al . , Nucl . Acids Res., 12, 9441 
(1984) ; Kramer, W. and Fritz, H.J. , Methods in Enzymology, 
154_, 350 (1987) ; Zoller, M.J. and Smith, M. Methods in 
Enzymology, 100, 468 (1983)). 

La synthese d'ADN modifies peut egalement etre faite en 
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utilisant des techniques de synthese chimique bien connues 
telles que par exemple la methode au phosphotriester 
[Letsinger, R.L and Ogilvie, K.K., K . Am. CHEM. Soc . , 91,3350 
(1969) ; Merrifield, R.B., Sciences, 150, 178 (1968)] ou la 
5 methode a la phosphoamidite [Beaucage, S.L and Caruthers, 

M .H., Tetrahedron Lett., 22, 1859 (1981) ; McBRIDE, L.J. and 
Caruthers, M.H. Tetrahedron Lett., 24 245 (1983)] ou encore 
par la combinaison de ces methodes. 

Les polypeptides de la presente invention peuvent done 
10 etre prepares par les techniques connues de 1'homme du 
metier, notamment partiellement par synthese chimique ou 
encore par la synthese de l'ADNc par expression dans une 
cellule note procaryote ou eucaryote comme indique ci-apres. 
... 1 La presente invention a particulierement pour objet le 
15 procede de preparation de la proteine recombinante hTFIHA 
ayant la sequence d'acides amines SEQ ID N°2. Ce procede 
inclut 1' expression de la sequence d'ADN. comme defini ci- 
dessus dans un note approprie puis l'isolement et la purifi- 
cation de ladite proteine recombinante. 
20 Pour produire le polypeptide de la presente invention, 

on peut notamment utiliser les techniques de l'ADN recombi- 
nant en utilisant les methodes de genie genetique et de 
culture cellulaire connues de 1'homme du metier. On peut 
ainsi proceder par les etapes suivantes : d'abord preparation 
25 du gene approprie, puis incorporation de ce gene dans un 
vecteur, trans fert du vecteur porteur du gene dans une 
cellule note appropriee, expression du gene et enfin, purifi- 
cation de la proteine cod£e par ce gene. 

Les sequences d'ADN selon la presente invention et notamment 
3 0 SEQ ID N° 3 ou SEQ ID N°4 peuvent etre preparees selon les 
techniques connues de 1'homme du metier, notamment par 
synthese chimique, par criblage d'une banque genomique ou 
d'une banque d'ADNc a l'aide de sondes d' oligonucleotides de 
synthese par les techniques connues d' hybridation ou encore 
35 par reverse transcriptase a partir d'ARN messager (ARNm) . 

L'avantage de la technique comprenant d'abord l'isole- 
ment d'ARNm par extraction des ARN totaux puis la synthese 
d'ADNc a partir de ces ARNm par reverse transcriptase reside 
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notamment dans le fait que 1'ARNm ne contient pas les introns 
alors que ces sequences non codantes sont presentes dans 
l'ADN genomique. 

On peut done notamment proceder comme suit. 
5 On extrait d'abord les ARN totaux provenant d'une lignee 
cellulaire telle que par exemple la lignee cellulaire Raj i 
CRNA Plus, BIOPROBE) et a partir de ces ARN, on procede 
ensuite a la synthese de l'ADNc recherche en utilisant 
notamment un kit tel que ARN PCR kit (Perkin Elmer) . 
.0 on peut noter que dans le cadre de la presente inven- 

tion, deux oligonucleotides localises aux extremites de la 
sequence codante htfUIA publiee par ARAKAWA (figure 5) ont 
ete synthetases soit OLT5 et OLT3 definis comme suit : 

- OLT5 : 5' CGGGGTAC CAAAA ATG CGC AGC AGC GGC GCC GAC 3' soit 
5 SEQ ID N°5 et 

- 0LT3 : 5' CGGTCTAGA TTA GCC AAG GGT AAG TAC TGC 3' soit SEQ 
ID N°9 

mais ces deux oligo-nucleotides n'ont pas permis d'obtenir un 
produit d' amplification par PCR. 
0 Ainsi dans le cadre de la presente invention, la 

sequence codante de hTFIIIA a ete isolee en deux etapes : 
d'abord identification de la partie 3' puis identification de 
la partie 5 ' . 

Apres identification des parties 3' et 5', un site de 
5 restriction Hindlll localise sur chacun de ces fragments a 
ensuite permis de reconstituer la sequence complete recher- 
chee comme indique ci-apres dans la partie experimental . 
On a done procede comme suit : 

La partie 3' a ete amplifiee a 1'aide de la pfu polymerase 
0 (STRATAGENE) en utilisant comme amorce les oligonucleotides 
OLT5.2 et TFIIIA 3 ' Smal soit : 

- OLT5.2 : 5 ' TCCTTCCCTGACTGCAGCGCC 3' soit SEQ ID N°6 et 

- TFIIIA3'SmaI : 5 ' CCT CCC GGG GCC AAG GGT AAG TAC TGC AAC 
3 ' soit SEQ ID N°10 

Les amorces d' amplification ou primers sont choisies en 
fonction de la partie a amplifier selon des criteres usuels 
pour 1 ' homme du metier. 

Les amorces utilisees dans la presente invention ont ete 
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choisies dans la sequence htflllA de ARAKAWA representee a la 
figure 5 . 

Les sequences SEQ ID N°6, SEQ ID N°7 et SEQ ID N°8 sont 
situees respectivement aux positions 320-340 <5'-3'), 361-380 
5 (sequence reverse et complementaire) et 391-410 (sequence 
reverse et complementaire) de cette sequence* htf IIIA de 
ARAKAWA. 

Les sequences SEQ ID N°5, SEQ ID N°9 et SEQ ID N°10 sont 
situees respectivement aux positions 20-40 (5'— 3'), 1271-1291 
.0 (sequence reverse et complementaire) et 1268-1288 (sequence 
reverse et complementaire) de cette sequence htf IIIA de 
ARAKAWA. 

On peut noter que dans les sequences SEQ ID N°5, SEQ ID N°9 
et.SEQ ID N°10 contiennent les sequences correspondant aux 
5 sites d' enzymes de restriction soit respectivement Kpnl, Xbal 
et Smal , 

L' oligonucleotide TFIIIA 3' Smal introduit un site de 
restriction Smal en aval de la sequence codante . Ce site 
permet si necessaire et si desire la fusion de la sequence 

0 codant pour hTFIIIA avec une sequence codant pour un peptide 
epitope de 1 ' hemaglutinine designe " TAG HA ". L' expression 
de la sequence codant pour TFIIIA peut done etre associee a 
celle de la sequence codant pour TAG HA qui peut etre detecte 
en analyse par Western blot, si le gene de fusion est 

5 exprime . 

Pour 1' identification de la parties', cette region a 
ete isolee par la technique de PCR ancree 5' (5 race System, 
GIBCO BRL ; pfu polymerase, STRATAGENE) . Deux PCR successives 
ont ete effectuees en utilisant comme amorce les oligonu- 
) cleotides suivants : UAP et TFIIIAPCR5 ' pour la premiere PCR 
et UAP et TFIIIA SEQ2 pour la seconde PCR. 
UAP est un oligonucleotide fourni dans le kit. 

Ces oligonucleotides ont les sequences suivantes : 

- TFIIIAPCR5 ' : 5' CACAAACAAATGGTCTCC 3' soit SEQ ID N°8 

- TFIIIA SEQ2 : 5' TGCACAGGTGCGCGTCAAGC 3' soit SEQ ID N°7. 

Les produits de ces PCR soit les fragments 5' et 3' 
amplifies sont ensuite purifies sur gel d' agarose et clones 
en utilisant le TA cloning kit (INVITROGEN) . On procede alors 
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au sequencage : l'ADN plasmidique de plusieurs clones 
independants est prepare (QIAGEN Plasmids KIT) et les 
fragments correspondant a la sequence codante de hTFIHA sont 
sequences sur les deux brins (Sequenceur ABI 3 77XL, PERKIN 
5 ELMER) . 

On peut done proceder comme suit et selon les techniques 
usuelles de clonage connues de l'homme du metier et notamment 
on procede au clonage par insertion de chaque fragment dans 
un plasmide fourni avec le kit commercial (TA cloning Kit 
10 Invitrogen) puis transformation d'une souche bacterienne par 
le plasmide ainsi obtenu. On peut utiliser notamment la 
souche E. coli XL1 Blue. 

Les clones sont ensuite cultives pour extraire l'ADN 
pla-smidique selon les techniques classiques de l'homme du 
15 metier referencees ci-dessus (Sambrook, Fritsh et Maniatis) . 

On procede au sequencage de l'ADN du fragment amplifie 
contenu dans l'ADN plasmidique. 

La compilation des donnees de la sequence ainsi obtenues 
fait apparaitre qu'en 3', 1'essentiel de la sequence isolee 
20 correspond a la sequence htfUIA de Drew et al . 

En 5', la sequence la plus longue debute en position 60 de la 
sequence htfUIA de Arakawa et al . , representee a la figure 
2F, et fait apparaitre 1' insertion d'un nucleotide C en 
position 127 par rapport a cette sequence. Si 1 ' on peut 
25 supposer que la synthese de l'ADNc dans 1 ' application de la 
technique decrite ci-dessus n'a pas ete complete, 1' insertion 
d'un nucleotide cree cependant un probleme majeur. En effet, 
1' addition d'un nucleotide dans la sequence codante cree un 
decalage de la phase de lecture. Afin de verifier la presence 
30 de ce nucleotide dans le gene htfUIA, de l'ADN genomique 
humain a ete analyse par PCR. Cet ADN a ete soumis a une 
reaction PGR a i'aide de la pfu polymerase (STRATAGENE) ou de 
la Taq polymerase (Perkin Elmer) et en utilisant comme amorce 
les oligonucleotides OLT5 et TFIIIA SEQ2 nommes respecti- 
35 vement SEQ ID N°5 et SEQ ID N°7. Les deux produits PCR ont 
ete clones (TA cloning Kit) puis sequences. 

L' analyse des donnees de sequence confirme pour ces deux 
amplifications la presence de ce nucleotide C supplementaire 
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par rapport a la sequence htfUIA de ARAKAWA. L'ATG decrit 
initialement comme codon initiateur de la synthese proteique 
pour hTFIIIA de ARAKAWA ne peut done plus etre considere 
comme tel . 

5 On procede ensuite a 1' assemblage des sequences 5' et 3' 

et obtient un plasmide unique contenant la sequence 
recherchee de hTFIIIA de la presente invention. On 
reconstitue la sequence codante hTFIIIA- complete de la facon 
suivante. On digere un clone issu de 1 ' amplification de l'ADN 
10 genomique a 1 ' aide des enzymes de restriction EcoRI et 

Hindlll, et on obtient apres purification, un fragment de 350 
pb environ. On digere par ailleurs un clone issu de 
1' amplification de la partie 3' a 1'aide des enzymes de 
restriction Hindlll et Smal et on obtient apres purification, 
15 un fragment de 93 0 pb environ. 

On procede ensuite a la ligation de ces fragments dans 
le plasmide pYX223 (vecteur d' expression . pour la levure - 
R§D) prealablement digere par EcoRI et Smal. 

Un expose detaille des conditions dans lesquelles 
20 peuvent etre menees les operations indiqu£es ci-dessus est 

donne ci-apres dans la partie experimentale . On obtient ainsi 
un plasmide dans lequel est insere le gene de la presente 
invention et on obtient ainsi egalement ce plasmide introduit 
dans une cellule note en operant selon les techniques 
25 usuelles connues de 1 ' homme du metier. 

Le polypeptide de la presente invention peut etre obtenu 
par expression dans une cellule note contenant la sequence 
d'ADN codant pour le polypeptide de 1' invention prec<§dee 
d'une sequence promotrice convenable. La cellule note peut 
30 etre une cellule procaryote, par exemple E. coli ou une 

cellule eucaryote telle que les levures comme par exemple les 
ascomycetes parmi lesquels les Saccharomyces cerevisiae ou 
encore des cellules mammiferes comme les cellules Cos. 

La presente invention a particulierement pour objet un 
35 vecteur d' expression contenant une sequence d'ADN comme 
defini ci-dessus. 

Ainsi un tel vecteur d' expression selon la presente 
invention contient une sequence d'ADN qui peut etre la 
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sequence de nucleotides SEQ ID N°3 ou la sequence commencant 
au nucleotide 176 et se terminant au nucleotide 1270 de SEQ 
ID N°3 . 

Un tel vecteur d' expression selon la presente invention peut 
5 egalement contenir les sequences d'ADN qui hybrident avec les 
sequences definies ci-dessus et/ou presentent des homologies 
signif icatives avec ces sequences ou des fragments de 
celles -ci . 

Un tel vecteur d' expression selon la presente invention 
10 peut egalement contenir les sequences d'ADN qui comprennent 
des modifications introduites par suppression, insertion 
et/ou substitution d'au moins un nucleotide codant pour une 
proteine ayant la meme activite biologique que le facteur de 
transcription humain hTFIIIA. 
15 Les vecteurs d' expression sont des vecteurs permettant 

1' expression de la proteine sous le controle d'un promoteur 
convenable. Un tel vecteur peut etre un plasmide, un cosmide 
ou un ADN viral. Pour les cellules procaryotes, le promoteur 
peut etre par exemple le promoteur lac, le promoteur trp, le 
20 promoteur tac, le promoteur P-lactamase ou le promoteur PL. 
Pour les cellules de levure, le promoteur peut etre par 
exemple le promoteur PGK ou le promoteur GAL. Pour les 
cellules de tnammiferes, le promoteur peut etre par exemple le 
promoteur SV40.ou les promoteurs de 1 ' adenovirus . Des 
25 vecteurs type Baculovirus peuvent etre aussi utilises pour 
1' expression dans des cellules d'insectes. 

Les cellules notes sont par exemple des cellules proca- 
ryotes ou des cellules eucaryotes. Les cellules procaryotes 
sont par exemple E. coli, Bacillus ou Streptomyces . Les 
3 0 cellules botes eucaryotes comprennent des levures ainsi que 
des cellules d'organismes superieurs, par exemple des cellu- 
les de mammiferes ou des cellules d'insectes. Les cellules de 
mammiferes sont par exemple des fibroblastes tels que des 
cellules CKO ou BHK de hamster et des cellules Cos de singe. 
35 Les cellules d'insectes sont par exemple des cellules SF9. 
La presente invention concerne done un proced£ qui 
comprend 1' expression de la proteine hTFIIIA dans une cellule 
note transformee par un ADN codant pour la sequence 
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polypeptidique correspondant a la sequence SEQ ID N°2. 

Pour la realisation de la presente invention, les 
vecteurs utilises peuvent etre par exemple pGEX ou pBAD et la 
cellule note peut etre E. coli ou par exemple le vecteur 
5 pYX223 et la cellule note peut etre egalement S. cerevisiae. 

La presente invention a notamment pour 6b jet une cellule 
note transformed avec un vecteur tel que defini ci-dessus 
contenant le gene htflllA selon la presente invention. 

La presente invention a tres precisement pour objet le 
0 plasmide depose a la CNCM sous le numero 1-2071. 

II s'agit ainsi de la souche XL1 -Blue/pBShtf C2LHA renfermant 
le gene htflllA selon la presente invention. 

Les conditions operatoires dans lesquelles a ete realisee la 
presente invention sont decrites ci-apres dans la partie 

5 experimentale . 

La proteine hTFIIIA codee par le gene htflllA est done un 
facteur de regulation de la transcription. En effet, la 
proteine hTFIIIA codee par le gene de la presente invention a 
un role biologique comme proteine se liant a 1'ADN et le 

0 produit de ce gene est utile comme facteur de regulation de 
la transcription. 

En particulier, le gene de la presente invention est exprime 
dans differents tissus et joue probablement un role important 
dans 1 ' initiation de la transcription du gene de i'ARN ribo- 
5 somal 5S et dans le maintien de la stabilite de la transcrip- 
tion d'autres genes impliques notamment dans des fonctions de 
controle. 

Un tres grand nombre de maladies accompagnant un desordre 
dans le controle de la transcription ont recemment ete mises 

0 en evidence. Ainsi on a constate que certains produits 
oncogenes agissent comme des facteurs de regulation de la 
transcription et peuvent conduire a une cancerisation de 
cellules comme par exemple dans certaines leucemies ou encore 
que la production en trop grande quantite du facteur de 

5 regulation Hox2-4 induit une leucemie chez la souris. 

Par ailleurs, dans certaines maladies hereditaires , la 
proteine concernee peut etre en elle-meme normale, la 
pathogenicity resultant du mecanisme de transcription du gene 
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codant pour cette proteine. Notamment, de nombreuses maladies 
hereditaires montrent une anomalie de la quantite de 
proteines synthetisees ce qui est probablement du a un 
desordre au niveau de la synthese proteique pouvant notamment 
5 mettre en jeu le gene htfUIA et la proteine codee en tant 
que facteurs impliques dans le controle de la transcription 
de 1'ARN 5S. 

Le gene de la presente invention peut ainsi etre utilise 
pour la recherche d' anomalies au niveau de la transcription 
10 des genes et notamment pour 1 ' identification de maladies 

hereditaires ou pour 1' etude de maladies mettant en cause les 
facteurs de regulation et notamment la proteine codee par 
htf IIIA. 

.-/Le gene de la presente invention peut egalement etre 

15 utilise pour le traitement de certaines maladies a travers le 
controle de la transcription ou dans l y analyse de la 
pathogenie de ces maladies. 

La presente invention prevoit done une utilisation du 
gene htfUIA de la presente invention et de la proteine 

20 hTFIIIA de la presente invention, notamment pour contribuer a 
la comprehension du mecanisme de la transcription chez 
1'homme et pour contribuer egalement a la comprehension, au 
diagnostic et au traitement de maladies liees a un 
dereglement du mecanisme de transcription. Ainsi htf IIIA et 

25 la proteine hTFIIIA pourraient etre utilises dans le 

diagnostic ou 1 ' identification de maladies hereditaires comme 
certains cancers ou d'autres maladies resultant d'un controle 
anormal de la transcription. Ces facteurs peuvent egalement 
etre utiles dans 1' analyse des mecanismes de regulation de la 

30 transcription. 

La presente invention a ainsi pour objet 1 ' utilisation 
de la sequence d'ADM du gene du facteur de transcription 
humain htfUIA ou du polypeptide ayant la fonction de facteur 
de transcription humain code par ladite sequence d'ADN ainsi 

35 qu'il est defini ci-dessus pour la preparation de 

compositions utiles pour le diagnostic ou le traitement de 
maladies liees a un desordre dans le controle de la 
transcription . 
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De telles compositions sont preparees dans les 

conditions usuelles connues de 1'homme du metier. 

La presence invention a plus precisement pour objet 

1 ' utilisation telle que definie ci-dessus pour laquelle la 
5 maladie concernee est le cancer. Les figures 1 a 5 ci-apres 

presentent les illustrations suivantes . La figure 1 

represente la comparaison de la proteine hTFIIIA de la 

presente invention avec la proteine hTFIIIA de DREW. 

La figure 2 represente la comparaison de la proteine hTFIIIA 
0 de la presente invention avec la proteine hTFIIIA de ARAKAWA . 

La figure 3 represente la comparaison de la proteine hTFIIIA 

de DREW avec la proteine hTFIIIA de ARAKAWA. 

La figure 4 represente la sequence htfUIA de DREW et la 

proteine hTFIIIA correspondante . 
5 La figure 5 represente la sequence htfUIA de ARAKAWA et la 

proteine hTFIIIA correspondante. 

Les sequences indiquees dans la presente invention soit : SEQ 
ID N°l a SEQ ID N°10 sont decrites ci-apres. 
La partie experimentale ci-apres permet de decrire la 
0 presente invention sans toutefois la limiter. 
Partie experimentale 

Exemple 1 : clonage et sequencage du gene hTFIIIA 
I) Extraction des ARN totaux provenant de la lignee 
cellulaire humaine RAJI (RNA Plus, BIOPROBE) 
5 La lignee cellulaire humaine RAJI a ete choisie comme source 
d ' ARN totaux. Les cellules RAJI utilisees ont <§te cultivees 
dans les conditions usuelles de culture de cette lignee que 
connait 1'homme du metier. 

Pour extraire les ARN totaux de ces cellules, on a procede 
0- selon un protocole usuel en utilisant la solution 

d' extraction commerciale RNA Plus ® (BIOPROBE SYSTEMS) 
On a procede de la manidre suivante : 
a) homog£neisation : 

Les cellules cultivees en suspension sont sedimentees sans 
5 etre lavees au prealable pour eviter les risques de 

degradation des ARNm puis sont lysees par addition de la 
solution d' extraction du kit RNA plus ® a raison de 6 ml pour 
10 7 cellules. Les echantillons obtenus d'homog£nat peuvent 
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etre stockes a - 70 °C. 
b) extraction de l'ARN : 

Apres homogeneisation, on laisse 1 ' homogenat obtenu en a) ci- 
dessus a 4°C pendant 5 minutes afin de permettre la complete 

5 dissociation des complexes nucleoproteiques . On ajoute 

ensuite 0.2 ml de chloroforme pour 1 ml de la- solution de RNA 
Plus ® ajoutee ci-dessus en aj , on agite vigour eusement 
pendant 15 secondes et on laisse reposer dans la glace 
pendant 5 minutes. On centrifuge, a 12000 g et a 4°C, pendant 

0 15 minutes . 

II se forme alors deux phases bien visibles : 1 ' ADN et les 
proteines sont. retrouves dans la phase organigue ( phase 
inferieure) et a 1' interface. Les ARN sont dans la phase 
aqueuse (phase superieure) qui represente environ .40 a 50 % 
5 du volume total . 

c) Precipitation de l'ARN : 

On trans fere la phase aqueuse obtenue en b) dans un tube 
neuf, on ajoute un volume d' isopropanol , et on place 
1' tenant i lion, a 4°C pendant 15 minutes. On centrifuge 
1' echantillon pendant 15 minutes a 4°C et 12000g. On obtient 
un precipite qui forme un culot blanc- jaunatre au fond du 
tube . 

d) Lavage de l'ARN : 

On eiimine le surnageant de la solution obtenue en c) puis on 
lave le culot avec une solution d'ethanol a 75 % en utilisant 
au moins 0 . 8 ml d'ethanol pour 50 a 100 microgrammes d'ARN. 
On melange (vortex) , on centrifuge 10 minutes a 7500 g a 4°C 
et seche sous vide. L'ARN obtenu est alors repris dans 60 
microlitres de Tris 10 mM EDTA 1 mM pH=7 / 5. 
II) Synthese d'ADNc 
a) Reactifs utilises : 

Le kit commercial Gene Amp® RNA PCR Kit (Perken Elmer) a ete 
utilise pour cette synthase d'ADNc. 

Par 1 ' utilisation de ce kit, on obtient d'abord la reverse 
transcription de l'ARN en ADNc par la reverse transcriptase 
MuLV (Murine Leukemia Virus) . Un inhibiteur de la RNase 
isolee a partir de placenta humain est inclus afin d'inhiber 
certaines RNases de mammiferes. Les fragments d'ADNc sont 
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amplifies par reaction de polymerisation en chaine (PCR) . 
L ' enzyme utilisee pour cette reaction est la pfu polymerase 
(Stratagene) .. 

L ' expression dNTP designe les nucleotides dGTP, dATP , dTTP et 
5 dCTP . 

L ' expression PCR Buffer designe la solution renf ermant 500 mM 
KC1 et 100 mM HC1 a pH 8.3. 

L' expression 01igod(T)16 designe une sequence nucleotidigue 
constitute de 16 nucleotides dTTP. 
10 Des oligonucleotides sont utilises comme amorces dans la 
technique decrite ci-apres. 

Les concentrations indiguees ci-apres representent les 
concentrations finales dans le milieu reactionnel. 
b).. . Synthese de l / ADNc par reverse transcription : 

15 2 microlitres des ARN totaux (l microgramme) obtenus ci- 

dessus en l)d) sont preincubes a 65 °C pendant 5 minutes. On 
ajoute ensuite 8 microlitres de la solution reactionnelle 
suivante : 5mM MgC12 , lxPCR buffer, 1 mM de chaque dNTP, 5 % 
de DMSO, 1 U/microlitre d'inhibiteur de RNase, 2.5 U/micro- 

20 litre de reverse transcriptase MuLV, 2.5 microlitres de 

oligo(dT)16. On incube alors a 42 °C pendant une heure, puis a 
99°C pendant 5 minutes puis a 5°C pendant 5 minutes. 
Ill) Amplification par PCR, clonage et sequencage des 
sequences nucleot idiques 3' et 5' 

25 a) Conditions r§actionnelles : 

La bacterie Escherichia coli (E . coli) XL1- Blue type K12 
(Stratagene) a ete utilisee pour la preparation des plasmides 
de la presente invention. 

La croissance de cette bacterie a ete effectuee selon les 
30 conditions usuelles en milieu liquide LB qui renferme 10 g de 
bactotryptone, 5 g d'extrait de levure et 10 g de NaCl pour 
un litre d'eau et qui renferme egalement 100 microg/ml 
d' ampicilline (SIGMA) . 

La colonie a ete prelevee sur milieu solide LB + agar + 
35 ampicilline puis cultivee dans 100 ml de milieu LB et incubee 
jusqu'a DO (600nm) =0.8. 

L' incubation a ete effectuee a 37°C sous atmosphere normale 
et agitation a 225 rpm. 
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La viabilite de la souche est verifiee lorsque la souche 
pousse sur milieu LB + ampicilline a 100 microg/ml, 1 ' insert 
renfermant un.gene de resistance a 1 ' ampicilline bla. 
On peut noter qu'un gene de resistance a 1 ' ampicilline bla 
5 fait partie du vecteur du kit {TA cloning Kit - Invitrogen) 
, dans lequel sont clones les fragments de htfUIA. Ainsi, la 
selection des souches renfermant les plasmides contenant le 
gene htfUIA de la presente invention peut etre operee par la 
culture des souches dans ce milieu qui renfermant de l'ampi- 
0 cilline {100 microg/ml) , un tel milieu permettant la survie 
uniquement des souches qui renferment le gene de resistance a 
1' ampicilline et ainsi uniquement des souches qui renferment 
le gene htfUIA de la presente invention. 

Pour' la conservation des souches obtenues, 15 % de glycerol. 
5 sont ajoutes au milieu de culture : les cultures sont done 
conservees dans le milieu de suspension LB + 100 microgram- 
mes/ml d ' ampicilline + 15 % de glycerol a -la concentration 
bacterienne de DO (SOOnm) = 0.8 sous forme d' aliquot s en 
cryotubes de 1 ml par tube. 

Pour le sequencage, 1'ADN plasmidique de plusieurs bacteries 
"issues de chacun des clonages indiques ci-apres est prepare 
en utilisant un kit commercial (Qiagen Plasmids kit) . Les 
fragments correspondant a la sequence codante de htfUIA sont 
sequences sur les deux brins suivant les techniques 
classiques cennues de 1 ' homme du metier (utilisation du 
sequenceur ABI 377 XL, Perkin Elmer) . 
k) Amplification par PCR, et clonaqe des sequences 
nucleotidiques 3' et 5' : 

1) Amplification et clonage de la sequence nucleotidique 3' 
Deux amorces d' amplification (primers) ont ete choisies 
d'apres la sequence publiee HTFUIA de ARAKAWA. Ces amorces 
OLT3 ou TFIIIA3'SmaI et OLT5 . 2 sont nominees respectivement 
SEQ ID N°10 et SEQ ID N°6. 

Ces oligonucleotides sont choisis dans la sequence hTFIIIA 
publiee de ARAKAWA (figure 5) et sont synthetises selon les 
m£thodes classiques connues de 1 ' homme du metier. 
L' oligonucleotide TFIIIA3'SmaI introduit un site de 
restriction Smal en aval de la sequence codante. Ce site 
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permettra la fusion de la sequence nucleotide que 3' de 
htflllA avec une sequence codant pour le peptide TAG 
hemaglutinine .. 

Ainsi, ie peptide resultant de 1' expression de la sequence 
5 clonee comprendra done a la fois la sequence .de htf IIIA de la 
presente invention et cells du TAG KA et pourra ainsi etre 
detecte en analyse par Western selon les' techniques usuelles 
connues de 1 ' homme cu metier. 

On procede de la facon suivante : 2 microlitres d'ADNc obtenu 
0 ci-dessus en II) b) sont ajoutes a SO microlitres de la 

solution reactiormelle suivante: 2mM MgC12, IxPCR buffer, 200 
nanogrammes/ml. de - chaque dNTP, les primers T7IIIA3 ' SMAI et 
OLT5.2 a raison de 0.15 micromoles/1 pour chacun, 5 % de DMSO 
ec.-2.-l5 U AmpliTaq ADN polymerase. 
5 L'ADNc est ainsi soumis a 30 cycles PCR d'abord a 94 °C , 
pendant une minute puis a 65 °C pendant 1 minute puis a 72°C 
pendant 1 minuce. 

Les produits amplifies par PCR ainsi obtenus sont done des 
fragments 3' d' environ 970 paires de bases. 
Les fragments 3' obtenus ci-dessus sont clones dans le 
vecteur pCRII en utilisant le TA cloning Kit (Invitrogen) . 
Le plasmide ainsi obtenu est nomme 5.2 Raji 2.9. 
Ce plasmide est transfere dans la souche E. coii XL1 Blue. 
On obtient done ainsi la souche £. coli transformee oaf le 
plasmide 5.2 Raji 2.9. 

2) Amplification et clonage de la sequence nucleotidique 5' 
La portion S' du gene htflllA de la presente invention a ete 
isolee par la technique dite de PCR ancree 5' en utilisant un 
kit commercial (5 'RACE System, Rapid Amplification of ADNc 
Ends, GI3CO SRL) . 

Deux amorces d' amplification (primers) ont ete choisies dans 
la sequence publiee htflllA de ARAKAWA (cf . figure 5) . 
Ces amorces TF IIIAPCR5 ' et TFIIIA SEQ2 sont nominees 
respectivement SEQ ID N°8 et SEQ ID N°7. 

Une chaine homopolymerique est ajoutee a l'extremite 3' de 
1'ADNc en utilisant du dATP et la Terminal desoxynucleotidyl 
transferase (TdT) : 10 microlitres d ' ADNc obtenu ci-dessus en 
II) b) sont incubus a 3 7°C pendant 10 minutes dans la 
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solution reactionnelle 1 X tailing buffer {solution du Kit 
commercial) et 0.2 mM de dATP et TdT. La TdT est inactivee 
pendant 10 minutes a 65 °C et la reaction est ensuite mise a 
4°C. 

5 La reaction est alors directement amplifiee par PCR : 10 

microl'itres de la reaction TdT sont ajoutesa 50 microlitres 
de solution reactionnelle PCR soit 1.5 mM de MgC12, lxPCR 
buffer, 2 00 nanomoles/ml de chaque dNTP , les ..primers UAP et 
TFIIIA PCR5 ' a raison de 0.2 micromoles/1 pour chacun, 5 % de 
10 DMSO et 2.5 U AmpliTaq ADNpolymerase . 

Le primer UAP est un oligonucleotide fourni avec le kit 
commercial . 

L'ADNc est ainsi soumis a 30 cycles PCR d'abord a 94 °C 
pendant une minute, puis a 65 °C pendant 1 minute puis a 72°C 

15 pendant 1 minute . 

Les produits amplifies par cette premiere PCR soit PCR1 sont 
soumis a une seconde reaction d' amplification par PCR en 
utilisant le primer UAP et un primer specif ique TFIIIASEQ 2. 
On procede de la facon suivante : 5 microlitres de PCR1 sont 

20 ajoutes a 50 microlitres de la solution reactionnelle de PCR 
indiquee ci-dessous (1.5 mM de MgCl2, lxPCR buffer, 200 
micromoles/1 de chaque dNTP, les primers UAP et TFIIIA SEQ2 a 
raison de 0.2 micromoles/1 pour chacun, 5 % de DMSO et 2.5 U 
AmpliTaq ADN polymerase. 

25 L ' ADN est alors soumis a 30 cycles PCR d'abord a 94°C pendant 
une minute, puis a 65 °C pendant 1 minute puis a 72 °C pendant 
1 minute . 

Les produits amplifies par cette seconde PCR soit PCR2 sont 
purifies sur gel d' agarose. Des fragments 5' d' environ 380 

30 paires de bases sont ainsi isol£s. 

Les fragments 5' obtenus ci-dessus sont alors clones dans le 
vecteur pCRII en utilisant le TA cloning Kit (Invitrogen) . 
Le plasmide ainsi obtenu est nomme ADNc-DMSO-3 
Ce plasmide est transfere dans la souche E. coli XLl Blue. 

3 5 On obtient done ainsi la souche E. coli transformed par le 
plasmide ADNc-DMSO-3. 

3) Verification de la sequence 5' par amplification d'ADN 
genomique - Construction du plasmide 5 geno-3 
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On extrait de 1'ADN genomique humain a partir de cellules 
humaines de foie selon les methodes usuelles connues de 
l'homme du metier. 

On procede a une amplification par PCR de 1 ' ADN genomique 
5 humain de la facon suivante : 

2 microgrammes d'ADN genomique humain obtenu comme indique 
ci-dessus sont ajoutes a 100 microlitres de la solution 
reactionnelle de PCR suivante : 2mM MgCl2, 1 x native Pfu ADN 
polymerase buffer, 2 00 nanogrammes/ml de chaque dNTP , les 
10 primers OLT5 et TFIIIA SEQ2 a raison de 0.15 micromoles/1 
pour chacun, 5 % de DMSO et 5 U pfu polymerase. 
OLT5 et TFIIIA SEQ2 sont nommes respectivement SEQ ID N°5 et 
SEQ ID N°7. 

Le- .milieu reactionnel est ainsi soumis a 30 cycles PCR 
15 d'abord a 94 °C pendant une minute, puis a 60 °C pendant 1 
minute puis a 72 °C pendant 1 minute. 

Les produits amplifies par PCR ainsi obtenus sont des 

fragments d'ADN d' environ 360 paires de bases. 

Les fragments ainsi obtenus sont clones dans le vecteur pCR- 
20 Script en utilisant le pCR-Script SK(+) Cloning kit 

(Stratagene) . 
. Le plasmide ainsi obtenu est nomme 5 geno-3 . 

Ce plasmide est transfere dans la souche E . coli XL1 Blue. 

On obtient done ainsi la souche E . coli transformee par le 
2 5 plasmide 5 geno-3 . 

4) Clonage du gene htfUIA selon la presente invention - 

Construction du plasmide pYX TFIIIALHA 

On reconstitue la sequence codante htfUIA complete par 
1' assemblage des deux fragments 3' et 5' obtenus ci-dessus en 
30 III) b) 1) et III) b) 3) 

Un site de restriction Hind III localise sur chacun des 
fragments 3' et 5' obtenus ci-dessus permet de reconstituer 
la sequence complete. 

Le plasmide 5 geno-3 obtenu ci-dessus en III) b)3) est digere 
35 par les enzymes de restriction EcoRl et Hindlll. Le site 
EcoRl est situe a 11 nucleotides en amont de la sequence 
codante . 

On obtient apres purification sur gel d' agarose des fragments 
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d' environ 350 paires de bases. 

On procede alors a la ligation avec le vecteur pYX/EcoRI + 
Hindlll et obtient le vecteur pYXTFIIIAS' . 
On procede ensuite a 1' addition du fragment 3' sur le 
5 fragment 5' : le plasmide 5.2 Raji 2.9 obtenu ci-dessus en 
III) b)l), est digere par les enzymes de restriction Hindlll 
et Smal. 

Apres purification sur gel d' agarose, on obtient un fragment 
d' environ 930 paires de bases. Ce fragment est insere dans le 
10 plasmide pYXTFIIIAS ' obtenu ci-dessus prealablement digere 
par les enzymes de restriction Smal et Hindlll. 
On obtient ainsi le plasmide p YXTF 1 1 1 ALHA qui contient done 
le gene hTFIHA de la presente invention. 

Exemple 2 : Construction de la souche XL1 Blue/pYX TFIIIALHA 
15 Pour la preparation de la souche XLl-Blue/ pYX TFIIIALHA, on 
procede selon les techniques connues de 1 ' homme du metier 
(ref ci-dessus : Sambrook, Fritsh et Maniatis) a partir de la 
souche E. Coli XL1- Blue type K12 (Stratagene) et introduit 
le plasmide pYX TFIIIALHA obtenu ci-dessus a 1'exemple 1. 
2 0 Exemple 3 : Construction du plasmide pBS - tf C2LHA 

On utilise le vecteur p3S-SK> (Stratagene) dans lequel on 
integre un insert codant pour le gene htfUIA de la presente 
invention. On procede comme suit : le plasmide pYXTFIIIALHA 
obtenu ci-dessus a 1'exemple 1 est digere par 1' enzyme de 
25 restriction EcoRI , cette extremite est remplie a 1 ' aide de 

l'ADN Polymerase {fragment de Klenow) et en presence de dNTP. 
Ce plasmide est ensuite digere par Nhe I et le fragment 
correspondant a la sequence de htfUIA selon la presente 
invention est purifie. Ce fragment est insere dans le vecteur 
30 pBS-SK+ prepare comme suit : le vecteur est diger<§ par EcoRI, 
ce site est rempli a 1 ' aide de l'ADN polymerase puis digere 
par Xbal . 

On obtient ainsi le plasmide pBS- tf C2LHA. 

Exemple 4 : Construction de la souche XL1 -Blue/pBS- tf C2LHA 
35 Pour la preparation de la souche XL1 -Blue/pBS- tfC2LHA / on 
procede selon les techniques connues de 1 ' homme du metier a 
partir de la souche E. Coli XL1- Blue type K12 (Stratagene) 
et introduit le plasmide pBS - t f C2LHA obtenu ci-dessus a 
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1 ' exemple 3 . 

Un echantillon de la souche obtenue soit E. Coli XL1- Blue 
type K12 (Stratagene) contenant le vecteur pBS-SK+ 
(Stratagene) avec un insert codant pour tfC2 (partie codante 
5 ADNc contenant la region codante de htfUIA) soit XL1- 

Blue/pBS-tf C2LHA a ete depose a 1'Institut Pasteur 25, rue du 
Docteur ROUX Paris 75015 a la CNCM le 15 Septembre 1998 sous 
le numero 1-2071. 

Exemple 5 : Identification du codon initiateur de la synthese 
10 proteique . 

La purification de la proteine hTFIIIA a ete decrite par 
Moorefield et al(l994) [reference : the Journal of 
Biological Chemistry, Vol. 269, N° 33, pp. 20857-20865, 1994, 
Purification and Characterization of Human Transcription 

15 Factor IIIA, B. Moorefield and R. G. Roeder] . 

La proteine hTFIIIA identified par Moorefield a un poids 
moleculaire de 4 2 kDa . On peut noter que- le poids moleculaire 
th^orique de la proteine hTFIIIA codee par la sequence 
htfUIA de ARAKAWA est de 47 kDa. 

20 La synthese proteique est generalement initiee au niveau d'un 
codon ATG. Cependant la sequence codante de htfUIA de la 
presente invention ne contient pas de codon ATG en phase. 
II a ete demontre que des codons differents de ATG, en 
particulier les codons CTG ou GTG sont des codons d'initia- 

25 tion de la traduction dans des transcrits cellulaires 
natureis . 

Par des techniques connues de l'homme du metier telles que 
des experiences de traduction in vitro de la sequence htfUIA 
selon la presente invention obtenue ci-dessus a 1' exemple 1 
30 et par des tests d' expression dans des cellules de mammiferes 
comme des cellules Cos, le codon initiateur de la synthese 
proteique de hTFIIIA selon la presente invention a ete mis en 
evidence . 

Dans le cadre de la presente invention, il a ainsi ete mis en 
35 evidence que le codon initiateur de la synthese proteique de 
hTFIIIA selon la presente invention est le codon CTG qui se 
trouve a la position 176-178 de SEQ ID N°3. 
Analyse des resultats 
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L ' analyse des resultats obtenus par les preparations des 
exemples indiques ci-dessus fait apparaltre les points 
suivants relatifs a la sequence codante de htfUIA : 

- en 3' (ci-dessus en III) b)l)) 1'essentiel de la sequence 
5 isolee dans la presente demande correspond a la sequence 

htf IIIA' de DREW 

- en 5' (ci-dessus en III) b)3)) la sequence la plus longue 
des fragments obtenus par la preparation decrite ci-dessus en 
III) b)3) debute en position 20 de la sequence htf IIIA de 

0 ARAKAWA et fait apparaitre 1' insertion d'un nucleotide en 
position 127 de la sequence htf IIIA de ARAKAWA . 
Les resultats obtenus par les preparations decrites ci-dessus 
de htf IIIA. selon la presente invention confirment qu'un 
nucleotide en position 127 omis dans la sequence de ARAKAWA 

5 existe bien dans le gene humain htf IIIA. 
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RE VEND I CAT I ONS 

1) Sequence d'ADN du gene htflllA codant pour une proteine 
ayant la fonction biologique du facteur de transcription 
humain hTFIHA. 

5 2) Sequence d'ADN du gene htflllA du facteur de transcription 
humain hTFlliA selon la revendication 1 codant pour la 
sequence d'acides amines SEQ ID N°2. 

3) Sequence d'ADN du gene htflllA selon la revendication 1 ou 
2 contenant la sequence de nucleotides SEQ ID N°3 
10 4) Sequence d'ADN du gene htflllA selon les revendications 1 
a 3 contenant la sequence de nucleotides SEQ ID N°4. 
5) Sequence d'ADN selon la revendication 4 ayant la sequence 
commencant au nucleotide 176 et se terminant au nucleotide 
12-7-t) de SEQ ID N°3 . 
15 6) Sequence d'ADN codant pour le facteur de transcription 
humain hTFIIIA selon les revendications 1 a 5 ainsi que 'les 
sequences d'ADN qui hybrident avec celle-ci et/ou presentent 
des homologies signif icatives avec cette sequence ou des 
fragments de celle-ci et qui codent pour une proteine ayant 
2 0 la meme fonction. 

7) Sequence d'ADN selon les revendications 1 a 6 comprenant 
des modifications introduites par suppression, insertion 
et/ou substitution d'au moins un nucleotide codant pour une 
proteine ayant la meme activite biologique que le facteur de 

25 transcription humain hTFIIIA. 

8) Sequence d'ADN selon 1 ' une des revendications 1 a 7 ainsi 
que les sequences d'ADN similaires qui ont une homologie de 
sequence nucleotidique d'au moins 50 % ou au moins 60 % et de 
preference au moins 70 % avec ladite sequence d'ADN. 

0 9) Sequence d'ADN selon 1 ' une des revendications 1 a 8 ainsi 
que les sequences d'ADN similaires qui codent pour une 
proteine dont la sequence en AA a une homologie d'au moins 
40 % et notamment de 4 5 % ou d'au moins 5 0 %, plutot au moins 
60 % et de preference au moins 70 % avec la sequence en AA 

5 codee par ladite sequence d'ADN. 

10) Polypeptide ayant la fonction de facteur de transcription 
humain hTFIIIA et ayant la sequence en acides amines SEQ ID 
N°2 codee par la sequence d'ADN selon 1 ' une des 
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revendications 1 a 9 et les analogues de ce polypeptide. 

11) Procede de preparation de la proteine recombinante 
hTFIIIA ayant la sequence d'acides amines SEQ ID N°2 
comprenant 1 ' expression de la sequence d'ADN selon 1 ' une des 

5 revendications 1 a 9 dans un note approprie puis l'isolement 
et la purification de ladite proteine recombinante 

12) Vecteur d' expression contenant la sequence d'ADN selon 
l'une des revendications 3 a 9. 

13) Cellule note transformee avec un vecteur selon la 
10 revendication 12 

14) Plasmide depose a la CNCM sous le numero 1-2071 

15) Utilisation du gene du facteur de transcription humain 
htfUIA ou du facteur de transcription humain code par ce 
gerie selon l'une des revendications 1 £ 10 pour la 

15 preparation de compositions utiles pour le diagnostic ou le 
traitement de maladies liees a un desordre dans le controle 
de la transcription. 

16) Utilisation selon la revendication 15 pour laquelle la 
maladie conc^znQe est le cancer. 
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1 MDPPAVVAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN 5 0 

n U| J J, | I ' 1 1 1 1 I I I I I I I I I I i I I I I I I I I I I I I I I i I I I I I M I I I 

1 . .PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN 4 8 

51 YSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHILTHTGEKPF 100 

nilll!lllll!IIJIIIIIIIIIMIj|lj|||||f!MIN!lllll 

4 9 YSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHILTHTGEKPF 98 

101 VCAATGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKTFKKHQQLK 150 
Mil 1 1 f I f H I I I I ! I I i I I I | ! { [ | I I ! | | | f I | | | j | | | { | | f [ | { 
9 9 VCAANGCDQKFNTKSNLKKHFERKHENQQKQ YI CS FEDCKKTFKKHQQLK 14 8 

151 IHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQKGCSFVAK 2 00 

fifMjlll!itilli!jllf!ll|j||||||i||||!|!|||||j||f| 

14 9 IHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQKGCSFVAK 198 

2 01 TWTELLKHVRETHKEE I LCEVCRKTFKRKD YLKQHMKTHAPERDVCRCPR 2 50 

{iMIiflMIMIIIIIIMIfltMlflfflliifllllllMMIfl 

19 9 TWTELLKHVRETHKEE I LCEVCRKTFKRKDYLKQHMKTHAPERDVCRCPR 24 8 
251 EGCG RTYTTVFNLQ S H I L S FHE ES RP FVCEHAGCG KTF AMKQS LTRHAVV 300 

„ lllflinitjlfllilMlllllilllllllllllMIIIIINlMM 

249 EGCGRTYTTVFNLQSKILSFHEESRPFVCEHAGCGKTFAMKQS LTRHAVV 298 
301 HDPDKKKMKXKVKKSREKRSLASHLSGYI P PKRKQGQGLSLCQNGES PNC 350 

flilfl!flMI!lf[jl!!lll!j||fj|f||j|l|il!||||||||li 

299 HDPDKKKMKLKVKKSREKRSLASHLSGYIP PKRKQGQGLSLCQNGES PNC 348 

3 51 VEDKMLSTVAVLTLG 3 65 

lillllllliillll 

34 9 VEDKMLSTVAVLTLG 3 63 
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1 MDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 42 

DrT _ ftT :|| HlfllllilllHlilllll!l||||||NIMIII!l 

51 PCuGGAGALDPPAWAES VSSLTIADAF IAAGESSAPTPPRPALPRRF I C 100 
4 3 SFPDCSANYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 92 

in MiilillllflllMMIIIilllMilllillllllMMIMIIIII 

101 SFPDCSAKYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 150 

93 THTGEKPFVCAATGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 142 
I I I I I I I I I I I I I I I I I I I I I I I I | | | | | ! I | | | | j M H | | | | | M i I 
151 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 200 

143 FKKHQQLKI HQCQHTNE P LF KCTQEGCGKHF AS P S KL KRHAKAHEG YVCO 192 

„ n fliinilMill-IIIEIIilMlllfllllllflMIIMIillllll 

201 FKKHQQLKIHQCQNTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 250 
193 KGCSFVAKTWTELLKHVRETHKEEILCEVCRKTFKRKDYLKQHMKTHAPE 242 

IlilNMilllMlllilillilllllllllllllllllllllllllll 

251 KGCSFVAKTWTELLKHVRETHKEEILCEVCRKTFKRKDYLKQHMKTHAPE 300 
243 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 292 

iiflllllfllMIIIMMIIfflllllllllltllllllllllllill 

3 01 RD VCRCPREGCGRTYTTVFNLQSHI LS FHEESRP FVCEHAGCGKTFAMKQ 3 50 
293 S LTRHAWHD PDKKKMKL KVKKS RE KRS LAS KLSGYIPP KRKQGQGLS LC 342 

lilfilMillfillilllliMIMI lllllllllllll 

351 SLTRKAVVKDPDKKKMKLKVKKSREKREFGLSSQWIYPPKRKQGQGLSLC 4 00 
34 3 QNGES PNCVEDKMLSTVAVLTLG 365 

MllllllliflillllfllMI 

4 01 QNGES PNCVEDKMIiSTVAVLTLG 42 3 
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51 PGLGGAGALDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 100 

lllllililillllf IflMlliiflllllflllllllll 

1 PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 4 0 

101 S F PDCS ANYS KAWKLDAHLCKHTGERP FVCDYEGCGKAF I RD YHLS RH I L 15 0 

111111111111111 III 1111111 II III Mill II Milium ||| 

41 S FPDCS ANYS KAWKLDAHLCKHTGERP FVCDYEGCGKAF I RDYHLSRHI L 90 
151 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 2 00 

IIIMMlllMlflMIIIMMilllllNlllflllillMllfMI 

91 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 14 0 
2 01 FKKHQQLKIHQCQKTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 250 

IIIMIMIIIIMIIIIIIIIIill E!lflllfit!llif!ll!|l!i 

141 FKKHQQLKIHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 190 
251 KGCSFVAKTWTELLKHVRETHKEEILCEVCRKTFKRKDYLKQHMKTHAPE 300 

IM.I!!jl!ll!![|j|||fltllM!fMfl!!ffll!IIIM||i!l| 

. 191 KGCS FVAKTWTELLKHVRETHKEE ILCEVCRKTFKRKD YLKQHMKTHAPE 240 

301 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 350 

I i I H I 1 f I f I I ! f I I I I | ! | | | | j | 1 f | | f | | | | f | | | j | | | ; { | | { [ | 
241 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 290 

351 SLTRHAVVHJDPDKKKMKLKVKKSREKREFGLSSQWIYPPKRKC^QGLSLC 400 

illinium if miiiiiinii immiiMii 

2 91 SLTRHAVVHDPDKKIG^KLKVKKSREKRSLASHLSGYIPPKRKQGQGLSLC 340 
4 01 QNGES PNCVEDKMLSTVAVXTLG 423 

imiiiimfimmiiii 

341 QNGES PNCVEDKMLSTVAVLTLG 3 63 
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1 CCGCCGGCCGTGGTCGCCGAGTCGGTGTCGTCCTTGACCATCGCCGACGC 50 
1PPAVVAESVSSLTIADA 17 



51 GTTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGC 100 
18 FIAAGESSAPTPPRPAL 34' 



101 TTCCCAGGAGGTTCATCTGCTCCTTCCCTGACTGCAGCGCCAATTACAGC 150 
35 PRRFI-CSFPDCSANYS 50 



151 AAAGCCTGGAAGCTTGACGCGCACCTGTGCAAGCACACGGGGGAGAGACC 200 
51 KAWKL.DAHLCKHTGER P 67 



2 01 ATTTGTTTGTGACTATGAAGGGTGTGGCAAGGCCTTCATCAGGGACTACC 2 50 
68 FVCDY.EGCGKAF I RDYH 84 



2 51 ATCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGT 3 00 
.85 LSRH ILTH7GEKPFVC 100 



3 01 GCAGCCAATGGCTGTGATCAAAAATTCAACACAAAATCAAACTTGAAGAA 350 
101 AANGCDQKFNTKSNLKK 117 



3 51 ACATTTTGAACG CAAACATGAAAATCAACAAAAACAATATATATG CAGTT 4 00 
118 HFERKHENQQKQYICS F 134 



4 01 TTGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCAT 450 
13S EDCKKTFKKHQQLKIH 150 



451 CAGTGCCAGCATACCAATGAACCTCTATTCAAGTGTACCCAGGAAGGATG 500 
151 QCQHTN EPLFKCTQEGC 167 



5 01 TGGGAAACACTTTGCATCACCCAGCAAGCTGAAACGACATGCCAAGGCCC 550 
168 GKHFAS PSKLKRHAKAH 184 



551 ACGAGGGCTATGTATGTCAAAAAGGATGTTCCTTTGTGGCAAAAACATGG 600 
185 EGYVCQKGCS FVAKTW 200 



601 ACGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATG 650 
201 TELLKHVRETHKEEILC 217 
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651 TGAAGTATGCCGGAAAACATTTAAACGCAAAGATTACCTTAAGCAACACA 700 

218 E V C R KT FKR KDY L KQHM 234 

701 TGAAAACTCATGCCCCAGAAAGGGATGTATGTCGCTGTCCAAGAGAAGGC 75 0 

235 KTHAPERDVCRCPREG 250 

751 TGTGGAAGAACCTATACAACTGTGTTTAATCTCCAAAGCCATATCCTCTC 8 00 

251 CGRTYTTVFNLQS HI LS 267 

801 CTTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCA 85 0 

268 FHEESRPFVCEHAGCGK 284 

851 AAACATTTGCAATGAAACAAAGTCT CACTAGGCATG CTGTTGTACATGAT 900 

285 TFAM KQSLTRHAVVHD 300 

9 01 CCTGACAAGAAGAAAATGAAGCTCAAAGTCAAAAAATCTCGTGAAAAACG 95 0 

301 P DKKKM KLKVKKS REKR. 317 

951 GAGTTTGGCCTCTCATCTCAGTGGATATATCCCTCCCAAAAGGAAACAAG 1000 

318 SLASHLSGYIPPKRKQG 334 

1001 GGCAAGGCTTATCTTTGTGTCAAAACGGAGAGTCACCCAACTGTGTGGAA 1050 

335 QGLSLCQNGESPNCVE 350 

1051 GACAAGATGCTCTCGACAGTTGCAGTACTTACCCTTGGCTAAGAACTGCA 1100 



351 DKMiSTVAVLTLG 



364 



1101 CTGCTTTGTTTAAAGGACTGCAGACCAAGGAGCGAGCTTTCTCTCAGAGC 1150 
1151 ATGCTTTTCTTTATTAAAATTAC 117 3 
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1 ATGCGCGATCTCCCGGAGCATGCGCAGCAGCGGCGCCGACGCGGGGCGGT 50 
1 MRSSGADAGRC 11 



51 GCCTGGTGACCGCGCGCGCTCCCGGAAGTGTGCCGGCGTCGCGCGAAGGT 100 
12 LVTARAPGSVPASREG 27 



101 TCAGCAGGGAG CCGTGGGC CGGGCG CGCGGTT CCCGG CACGTGTCT CGGC 15 0 
28SAGSRGPGARFPARVSA 44 



151 ACGTGGCAGCGCGCCTGGCCCTGGGCTTGGAGGCGCCGGCGCCCTGGATC 2 00 
45 RGSAPGPGLGGAGALDP 61 



2 01 CGC CGGC CGTGGTCGCCGAGTCGGTGT CGTCCTTGAC CATCGCCGACGCG 25 0 
62 PAVVAESVSSLTIADA 77 



251 TTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGCT 3 00 
78FIAAGESSAPTPPRPAL 94 



3 01 TCCCAGGAGGTTCATCTGCTTCCTTCCCrGACrrGCAGCGCCAATTACAGCA 3 50 
95 PRRFICSFPDCSANYSK 111 



3 51 AAGCCTGGAAGCTTGACGCGCACCTGTGCAAGCACACGGGGGAGAGACCA 400 
112 AWKLDAHLCKHTGERP 127 



4 01 TTTGTTTGTGACTATGAAGGGTGTGGCAAGGCCTTCATCAGGGACTACCA 450 
128 FVC DYE-GCGKAFI RDYH 144 



4 51 TCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGTG 50 0 
145 LS R H I LTHTGEKP FV CA 161 



5 01 CAGCCAATGGCTGTGATCAAAAATTCAACACAAAATCAAACTTGAAGAAA 550 
162 ANGCDQKFNTKSNLKK 177 



551 CATTTTGAACGCAAACATGAAAATCAACAAAAACAATATATATGCAGTTT 6 00 
178 HFERKHENQQKQYICSF 194 



6 01 TGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCATC 650 

195 EDCKKTFKKHQQLKI HQ 211 

651 AGTGC CAGAATACCAATGAAC CTCTATTCAAGTGTACC CAGGAAGGATGT 700 

212 CQNTNEPLFKC TQEGC 227 
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701 GGGAAACACTTTG CAT CAC CCAGCAAG CTG AAACG ACATG C CAAGG C CCA 750 
228 GKHFAS PSKL KRHAKAH 244 



751 CGAGGGCTATGTATGTCAAAAAGGATGTTCCTTTGTGGCAAAAACATGGA 800 

245 EGYVCQKGCS FVAKTWT 261 

8 01 CGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATGT 8 50 

262 ELLKHVRETHKEEILC 277 



851 GAAGTATGCCGGAAAACATTTAAACGCAAAGATTACCTTAAGCAACACAT 900 
278 EVCRKTFKRKDYLKQHM 294 



901 GAAAACTCATGCCCCAGAAAGGGATGTATGTCGCTGTCCAAGAGAAGGCT 950 
295 KTHAPERDVCRCPREGC 311 



951 GTGGAAGAACCTATACAACTGTGTTTAATCTCCAAAGCCATATCCTCTCC 1000 
3/12 GRTYTTVFNLQSHILS 327 



1001 TTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCAA 1050 
328 FHEES R PFVCEHAGCGK 344 



1051 AACATTTGCAATGAAACAAAGTCTCACTAGGCATGCTGTTGTACATGATC 1100 
345 TFAMKQS LTRHAVVHD P 361 



1101 CTGACAAG AAGAAAATGAAGCTCAAAGT CAAAAAAT CTCGTGAAAAACGG 1150 
362 DKKKMKLKVKKSREKR 377 



1151 GAGTTTGGC CTCTCATCTCAGTGGATATAT CCT CCCAAAAGGAAACAAGG 1200 

378 EFGLS SQWIYPPKRKQG 3 94 

12 01 GCAAGGCTTATCTTTGTGTCAAAACGGAGAGTCACCCAACTGTGTGGAAG 1250 

395 QGLSLCQNGE SPNCVED 411 



1251 ACAAGATGCTCTCGACAGTTGCAGTACTTACCCTTGGCTAAGAACTGCAC 1300 
412 KMLSTVAVLTLG* 424 



13 01 TGCTTTGTTTAAAGGACTGCAGACCAAGGAGTCGAGCTTTCTCTCAGAGC 13 50 



ATGCTTTTCTTTATTAAAATTACTGATGC^GAAAAAAAAAAAAAAAAAA 13 99 
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LI STAGE DE SEQUENCE 

<110> Hoechst Marion Roussel 

<12 0> Gene humain htfUIA et la proteine codee hTFIIIA. 

<130> 9823seq 

<140> 
<141> 

<160> 10 

<170> Patentln Vers. 2.0 

<210> 1 

<211> 1273 

<212> ADN 

<213> Human 

<220> 
<22i> CDS 

<222> (176) . . (1270) 
<400> 1 

atgcgcagca gcggcgccga cgcggggcgg tgcctggtga ccgcgcgcgc tcceggaagt 60 

gtgccggcgt cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 12 0 

acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgcc ctg 178 

Met 

1 

gat ccg ccg gcc gtg gtc gcc gag teg gtg teg tec ttg acc ate gee 226 
Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr He Ala 
5 10 15 

gac gcg ttc att gca gcc ggc gag age tea get ccg acc ccg ccg cgc 274 
Asp Ala Phe He Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg 
20 25 30 

ccc gcg ctt ccc agg agg ttc ate tgc tec ttc cct gac tgc age gcc 322 
Pro Ala Leu Pro Arg Arg Phe He Cys Ser Phe Pro Asp Cys Ser Ala 
35 40 45 

aat tac age aaa gcc tgg aag ctt gac gcg cac ctg tgc aag cac acg 3 70 
Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr 
50 55 60 65 

ggg gag aga cca ttt gtt tgt gac tat gaa ggg tgt ggc aag gcc ttc 418 
Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe 
70 75 80 

ate agg gac cac cat ctg age cgc cac att ctg act cac aca gga gaa 466 
He Arg Asp Tyr His Leu Ser Arg His He Leu Thr His Thr Gly Glu 
85 90 95 



aag ccg ttt gtt tgt gca gcc act ggc tgt gat caa aaa ttc aac aca 
Lys Pro Phe Val Cys Ala Ala Thr Gly Cys Asp Gin Lys Phe Asn Thr 
100 105 110 
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aaa tea aac ttg aag aaa cat ttt gaa cgc aaa cat gaa aac caa caa 562 
Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gin Gin 
115 120 125 

aaa caa tat ata tgc agt ttt gaa gac tgt aag aag acc ttt aag aaa 610 
Lys Gin Tyr lie Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys 
130 135 140 145 

cat cag cag ctg aaa ate cat cag tgc cag cat acc aat gaa cct eta 658 
His Gin Gin Leu Lys lie His Gin Cys Gin His Thr Asn Glu Pro Leu 
150 155 160 

ttc aag tgt acc cag gaa gga tgt ggg aaa cac ttt gca tea ccc age 706 
Phe Lys Cys Thr Gin Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser 
165 170 175 

aag ctg aaa cga cat gee aag gee cac gag ggc tat gta tgt caa aaa 754 
Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gin Lys 
180 185 190 

gga tgt tec ttt gtg gca aaa aca tgg acg gaa ctt ctg aaa cat gtg 802 
Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val 
195 200 205 

aga gaa acc cat aaa gag gaa ata eta tgt gaa gta tgc egg aaa aca 850 
Arg Glu Thr His Lys Glu Glu He Leu Cys Glu Val Cys Arg Lys Thr 
210 215 220 225 

ttt aaa cgc aaa gat tac ctt aag caa cac atg aaa act cat gec cca 3 98 
Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala Pro 
230 235 240 

gaa agg gat gta tgt cgc tgt cca aga gaa ggc tgt gga aga acc tat 946 
Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr 
245 250 255 

act act gtg ttt aat etc caa age cat ate etc tec ttc cat gag gaa 994 
Thr Thr Val Phe Asn Leu Gin Ser His He Leu Ser Phe His Glu Glu 
260 265 270 

age cgc cct ttt gtg tgt gaa cat get ggc tgt ggc aaa aca ttt gca 1042 
Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala 
275 280 285 

atg aaa caa agt etc act agg cat get gtt gta cat gat cct gac aag 1090 
Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys 
290 295 300 305 

aag aaa atg aag etc aaa gtc aaa aaa tct cgt gaa aaa egg agt ttg 113 8 
Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser Leu 
310 315 320 

gee tct cat etc agt gga tat ate cct ccc aaa agg aaa caa ggg caa 1186 
Ala Ser His Leu Ser Gly Tyr He Pro Pro Lys Arg Lys Gin Gly Gin 
325 330 335 

ggc tta tct ttg tgt caa aac gga gag tea ccc aac tgt gtg gaa gac 1234 
Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu Asp 
340 * 345 350 



aag atg etc teg aca gtt gca gta ctt acc ctt ggc taa 
Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 
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<210> 2 
<211> 365 
<212> PRT 
<213> Human 

<400> 2 

Met Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr lie 
15 10 15 

Ala Asp Ala Phe lie Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro 
20 25 30 

Arg Pro Ala Leu Pro Arg Arg Phe He Cys Ser Phe Pro Asp Cys Ser 
35 40 45 

Ala Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His 
50 55 60 

Thr Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala 
65 * 70 75 80 

Phe .-lie Arg Asp Tyr His Leu Ser Arg His He Leu Thr His Thr Gly 
85 90 95 

Glu Lys Pro Phe Val Cys Ala Ala Thr Gly Cys Asp Gin Lys Phe Asn 
100 105 110 

Thr Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gin 
115 120 125 

Gin Lys Gin Tyr lie Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys 
130 135 140 

Lys His Gin Gin Leu Lys He His Gin Cys Gin His Thr Asn Glu Pro 
145 150 155 160 

Leu Phe Lys Cys Thr Gin Glu Gly Cys Gly Lys His Phe Ala Ser Pro 
165 170 175 

Ser Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gin 
180 185 190 

Lys Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His 
195 200 205 

Val Arg Glu Thr His Lys Glu Glu He Leu Cys Glu Val Cys Arg Lys 
210 215 220 

Thr Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala 
225 230 235 240 

Pro Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr 
245 250 255 

Tyr Thr Thr Val Phe Asn Leu Gin Ser His He Leu Ser Phe His Glu 
260 265 270 

Glu Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe 
275 280 285 



Ala Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp 
290 295 300 
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Lys Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser 
305 310 315 320 

Leu Ala Ser His Leu Ser Gly Tyr lie Pro Pro Lys Arg Lys Gin Gly 
325 330 335 

Gin Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu 
340 345 350 

Asp Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 



<210> 3 
<211> 1273 
<212> ADN 
<213> Human 

<400> 3 



atgcgcagca 


gcggcgccga 


cgcggggcgg 


tgcctggtga 


ccgcgcgcgc 


tcccggaagt 


60 


gtgccggcgt^ cgcgcgaagg 


ttcagcaggg 


agccgtgggc 


cgggcgcgcc 


ggttcccggc 


120 


a'cgtgtctcg 


gcacgtggca 


gcgcgcctgg 


ccctgggctt 


ggaggcgccg 


gcgccctgga 


180 


tccgccggcc 


gtggtcgccg 


agtcggtgtc 


gtccttgacc 


atcgccgacg 


cgttcattgc 


240 


agccggcgag 


agctcagctc 


cgaccccgcc 


gcgccccgcg 


cttcccagga 


ggttcatctg 


300 


ctccttccct 


gactgcagcg 


ccaattacag 


caaagcctgg 


aagcttgacg 


cgcacctgtg 


360 


caagcacacg 


ggggagagac 


catttgtttg 


tgactatgaa 


gggtgtggca 


aggccttcat 


420 


cagggactac 


catctgagcc 


gccacattct 


gactcacaca 


ggagaaaagc 


cgtttgtttg 


480 


tgcagccact 


ggctgtgatc 


aaaaattcaa 


cacaaaatca 


aacttgaaga 


aacattttga 


540 


acgcaaacat 


gaaaatcaac 


aaaaacaata 


tatatgcagt 


tttgaagact 


gtaagaagac 


600 


ctttaagaaa 


catcagcagc 


tgaaaatcca 


tcagtgccag 


cataccaatg 


aacctctatt 


660 


caagtgtacc 


caggaaggat 


gtgggaaaca 


ctttgcatca 


cccagcaagc 


tgaaacgaca 


720 


tgccaaggcc 


cacgagggct 


atgtatgtca 


aaaaggatgt 


tcctttgtgg 


caaaaacatg 


780 


gacggaactt 


ctgaaacatg 


tgagagaaac 


ccataaagag 


gaaatactat 


gngaagtacg 


840 


ccggaaaaca 


tttaaacgca 


aagattacct 


taagcaacac 


atgaaaactc 


atgccccaga 


900 


aagggatgta 


tgtcgctgtc 


caagagaagg 


ctgtggaaga 


acctatacta 


ctgtgtttaa 


960 


tctccaaagc 


catatcctct 


ccttccatga 


ggaaagccgc 


ccttttgtgt 


gtgaacatgc 


1020 


tggctgtggc 


aaaacatttg 


caatgaaaca 


aagtctcact 


aggcatgctg 


ttgtacatga 


1080 


tcctgacaag 


aagaaaatga 


agctcaaagt 


caaaaaatct 


cgtgaaaaac 


ggagtttggc 


1140 


ctctcatctc 


agtggatata 


tccctcccaa 


aaggaaacaa 


gggcaaggct 


tatctttgtg 


1200 


tcaaaacgga 


gagtcaccca 


actgtgtgga 


agacaagatg 


ctctcgacag 


ttgcagtact 


1260 


tacccttggc 


taa 
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<210> 4 

<211> 1213 

<212> ADN 

<213> Human 

<400> 4 

gtgccggcgc cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 60 
acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctc ggaggcgccg gcgccccgga 12 0 
tccgccggcc gtggtcgccg agtcggtgtc gtccttgacc atcgccgacg cgttcattgc 180 
agccggcgag agctcagctc cgaccccgcc gcgccccgcg cttcccagga ggttcatctg 240 
ctcctcccct gactgcagcg ccaattacag caaagcctgg aagcttgacg cgcacctgtg 300 
caagcacacg ggggagagac cactcgtttg tgactatgaa gggtgtggca aggccttcat 360 
cagggactac catctgagcc gccacactct gactcacaca ggagaaaagc cgttngtttg 420 
tgcagccact: ggccgtgatc aaaaatccaa cacaaaatca aacttgaaga aacattttga 4 80 
acgcaaacat gaaaatcaac aaaaacaaca tatatgcagt tttgaagact gtaagaagac 540 
cttcaagaaa catcagcagc tgaaaaccca tcagtgccag cataccaatg aacctctatt 600 
caagtgtacc caggaaggat gtgggaaaca ctttgcatca cccagcaagc tgaaacgaca 660 
tgccaaggcc cacgagggct atgtatgtca aaaaggatgt tcctttgtgg caaaaacatg 720 
gacggaacnt ctgaaacatg cgagagaaac ccacaaagag gaaataccat gtgaagtatg 780 
ccggaaaaca cttaaacgca aagatcacct caagcaacac atgaaaactc atgccccaga 84 0 
aagggatgta tgtcgctgtc caagagaagg ctgcggaaga acctatacta ctgtgtttaa 900 
cctccaaagc cacatcctct ccttccatga ggaaagccgc cctcttgrgt gtgaacatgc 960 
tggccgtggc aaaacatttg caacgaaaca aagtctcacc aggcatgctg ttgtacatga 1020 
tcccgacaag aagaaaatga agctcaaagt caaaaaaccc cgtgaaaaac ggagtctggc 108 0 
ccctcatccc agtggataca tccctcccaa aaggaaacaa gggcaaggct tatctttgcg 1140 
tcaaaacgga gagtcaccca actgtgcgga agacaagacg ccctcgacag tcgcagtact 1200 
taccctcggc taa 1213 

<210> 5 
<211> 34 
<212> ADN 
<213> Human 

<400> 5 

cggggtacca aaaatgcgca gcagcggcgc cgac 34 

<210> 6 
<211> 21 
<212> ADN 
<213> Human 
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6 



<400> 6 

tccttccccg actgcagcgc c 



21 



<210> 7 
<211> 20 
<212> ADN 
<213> Human 

<400> 7 

tgcacaggtg cgcgtcaagc 2 0 



<210> 8 
<211> 20 
<212> ADN 
<213> Human 



<210> 9 
<2il> 3 0 
<212=> ADN 
<213> Human 

<400> 9 

cggtctagat tagccaaggg taagtactgc 3 0 

<210> 10 
<211> 30 
<212> ADN 
<213> Human 



<400> 8 

cacaaacaaa tggtctctcc 



20 



<400> 10 

cctcccgggg ccaagggtaa gtactgcaac 



30 



